趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码知识
从128到255这一页的字符集被称"扩展字符集"。等中国人们得到计算机时,已经没有可以利用的字节状态来表示汉字,况且有6000多个常用汉字需要保存呢。中国人民看到这样很不错,于是就把这种汉字方案叫做 "GB2312"。结果扩展之后的编码方案被称为 GBK 标准,GBK 包括了 GB2312 的所有内容,同时又增加了近20000个新的汉字和符号。他们打算叫它"Universal Multiple-Octet Coded Character Set",简称 UCS, 俗称 "UNICODE"。UNICODE 开始制订时,计算机的存储器容量极大地发展了,空间再也不成为问题了。是的,从 UNICODE 开始,无论是半角的英文字母,还是全角的汉字,它们都是统一的"一个字符"!
用户评论