通用字符集 (Universal Character Set, UCS) 和 Unicode 可以理解就是两个组织干的相同的事情,他们都想给世界上的所有字符统一编码。现在他们也都相互兼容,就是说对于同一个字符,UCS 和 Unicode 都会把他们映射成同一个 Code Point,反过来也一样。所以可以把他们当成是一回事。
【Unicode 与 UCS】有一些不同的地方,UCS 的编码空间本来是 0
到 0x7F FF FF FF
(32 位,第一位固定为 0)。但因为 UTF-16 代理对的实现方式,只能编码到 0x10 FF FF
范围。所以 UCS 标准也规定了只使用 0x10 FF FF
范围内的编码。
UCS-4 与 UCS,类似于 UTF-32 与 Unicode 的关系。因为 UCS 也规定了只使用 0x10 FF FF
范围内的编码,所以它两实际就是一回事。
UCS-2 与 UCS,类似于 UTF-16 与 Unicode 的关系。但不同的是,UCS-2 是固定两字节的,没有考虑辅助平面。可以把 UCS-2 当做是不支持辅助平面的 UTF-16。
相关文章:
- 详解字符编码与 Unicode
推荐阅读
- Unicode 标准化
- #yyds干货盘点#Golang 字符编码UTF-8Unicode之间的关系
- 定位|万字长文(关于sourcemap,这篇文章就够了)
- Appium升级后安装UnicodeIME-debug.apk 提示
- Appendix AUnicode
- Some characters were lost while converting from UNICODE to CP 0. Save to file anyway? winedt
- android中一些特殊字符(如(←↑→↓等箭头符号)的Unicode码值)
- Dapper.net Insert mssql unicode 乱码问题