Java中的Unicode系统

本文概要

  • 问题
Unicode是一种通用的国际标准字符编码,能够代表世界上大多数的书面语言。
为什么Java使用Unicode的系统?
【Java中的Unicode系统】在Unicode之前,有许多语言标准:
  • 美国信息交换的美国标准码。
  • ISO 8859-1适用于西欧语言。
  • KOI-8俄罗斯。
  • GB18030和BIG-5 for chinese,等等。
问题这导致了两个问题:
  • 特定的代码值对应于不同语言标准中的不同字母。
  • 大字符集语言的编码长度是可变的。一些常用字符编码为单个字节,另一些需要两个或更多字节。
解为了解决这些问题,开发了一种新的语言标准,即Unicode系统。
在unicode中,字符包含2个字节,所以java也对字符使用2个字节。
最小值:\ u0000
最高价值:\ uFFFF

    推荐阅读