java怎么把UTF-8里面的汉字转成Unicode

日期:2018-08-04 15:42:39 人气:1

java怎么把UTF-8里面的汉字转成Unicode

string.getbytes("ISO646-US") Unicode当然是一个很大的集合,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示阿拉伯字母Ain,U+0041表示英语的大写字母A,“汉”这个字的Unicode编码是U+6C49。 Unicode固然统一了编码方式,但是它的效率不高,比如UCS-4(Unicode的标准之一)规定用4个字节存储一个符号,那么每个英文字母前都必然有三个字节是0,这对存储和传输来说都很耗资源。
    A+
热门评论