以3个字为例:
规范序号 GBK碼位 自定义码 Unicode
7279 0xA54D U+E653 U+2C62F
7326 0xA47E U+E624 U+2C0CA
7334 0xA65E U+E6C4 U+2CDD5
本人到中文Unicode互换网http://javawind.net/tools/native2ascii.jsp?action=transform查了一下,它们的Unicode码如下:
d871de2f
d870dcca
d873ddd5
跟上面的Unicode码不一样。
这两种Unicode码该怎么样换算呢?
这3个字是:
规范序号 GBK碼位 自定义码 Unicode
7279 0xA54D U+E653 U+2C62F
7326 0xA47E U+E624 U+2C0CA
7334 0xA65E U+E6C4 U+2CDD5
本人到中文Unicode互换网http://javawind.net/tools/native2ascii.jsp?action=transform查了一下,它们的Unicode码如下:
d871de2f
d870dcca
d873ddd5
跟上面的Unicode码不一样。
这两种Unicode码该怎么样换算呢?
这3个字是:
解决方案
2
你要本人转换吗? 本人转换的话本人看标准.
库转的话,libiconv
库转的话,libiconv
40
U+2C62F这是原生编码UCS-4,d871de2f这是UTF-16编码。
转换方法:
d871 – d800 = 0071
de2f – dc00 = 022f
(0071 << 16 + 022f << 6) >> 6 = 2c62f
转换方法:
d871 – d800 = 0071
de2f – dc00 = 022f
(0071 << 16 + 022f << 6) >> 6 = 2c62f