1. 首页
  2. 编程语言
  3. PHP
  4. PHP使用自定义码表查询汉字拼音

PHP使用自定义码表查询汉字拼音

上传者: 2020-08-08 18:25:38上传 RAR文件 26.88KB 热度 17次
通过汉字GBK码计算出汉字的区位码,目前仅使用了GB2312的6763个汉字。实现了多音的查询。 如“啊”,其GBK码:45217,区位码:1601,因此可以通过第16区,第01位快速定位其位置。 每个正常读音(第一次出现的读音)占4个字节,前两个表示其读音的个数及在多音块中的偏移,后两位表示其读音的位置。 拼音部分为不定长,从其读音的位置先读1个字节,表示其拼音长度,再读出相应的拼音后还原。
下载地址
用户评论
码姐姐匿名网友 2020-08-08 18:25:38

对多音字的支持很不错,是属于gb2312编码的,需要自己转换才能支持utf8的汉字。