pkuseg python:pkuseg多领域中文分词工具; 用于多域中文分词的pkuseg工具包 源码
pkuseg:一个多领域中文分词工具包 pkuseg是基于论文[ ]的工具包。其简单易用,支持细分领域分词,有效提升了分词准确度。 目录 主要亮点 pkuseg具有如下几个特点: 多领域分词。以及以前的通用中文分词工具,此工具包同时致力于为不同领域的数据提供个性化的预训练模型。根据待分词文本的领域特点,用户可以自由地选择不同的模型。目前支持了新闻领域,网络领域,医药领域,旅游领域,以及混合领域的分词预训练模型。在使用中,如果用户明确待分词的领域,可加载对应的模型进行分词。如果用户无法确定具体领域,推荐使用在混合领域上训练的通用模型。各领域分词样例可参考 。 更高于的分词准确率。比例于其他
用户评论