1. 首页
  2. 编程语言
  3. Java
  4. 中文分词算法.docx

中文分词算法.docx

上传者: 2020-08-13 06:23:08上传 DOCX文件 17.79KB 热度 20次
1、颗粒度越大越好:用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切,如:“公安局长”可以分为“公安 局长”、“公安局 长”、“公安局长”都算对,但是要用于语义分析,则“公安局长”的分词结果最好(当然前提是所使用的词典中有这个词)
用户评论