永发信息网

UTF-8是按拼音顺序进行汉字编码的吗

答案:2  悬赏:50  手机版
解决时间 2021-11-28 12:38
  • 提问者网友:戎马万世
  • 2021-11-28 04:45
UTF-8是按拼音顺序进行汉字编码的吗
最佳答案
  • 五星知识达人网友:一秋
  • 2021-11-28 04:54
    不是按照拼音顺序,而是按照CJK编码顺序  
    UTF-8的的具体编码结构需参考ISO/IEC 10646标准

ISO/IEC 10646将其第一个平面(00组中的00平面)称作Basic Multilingual Plane(基本多文种平面),简称BMP。
    BMP中的 I区就是我们的汉字编码区域,原则是按照CJK统一编码的
I- Zone(4E至9F行)为表意文字编码区,我们将其称作汉字区,通常人们所说的CJK统一编码汉字就放在这个区域,从4E00到9FA5共20902个编码汉字。
全部回答
  • 1楼网友:詩光轨車
  • 2021-11-28 05:24
互联网的普及,强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种unicode的实现方式。其他实现方式还包括UTF-16和UTF-32,不过在互联网上基本不用。重复一遍,这里的关系是,UTF-8是Unicode的实现方式之一。
UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。
UTF-8的编码规则很简单,只有二条:
1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。
2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。
望采纳!
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯