1. 首页
  2. 数据库
  3. 其它
  4. 传统蒙古文“同形不同码”问题研究

传统蒙古文“同形不同码”问题研究

上传者: 2021-03-21 12:47:20上传 PDF文件 224.69KB 热度 3次
设计并实现了一种基于语料库的传统蒙古文同形不同码识别系统。通过网络爬虫获取原始语料,然后对语料进行预处理并生成词表和倒排索引。基于词表利用GDI和传统蒙古文字库对每个传统蒙古文词生成字形图,并根据字形图之间的相似度识别出相同的字形。系统根据倒排索引、同形词列表统计出语料中传统蒙古文同形不同码的情况。实验结果显示,同形不同码问题在传统蒙古文中普遍存在,反映出了制定相关标准的迫切性。
用户评论