1. 首页
  2. 编程语言
  3. Python
  4. 文本分类系统

文本分类系统

上传者: 2019-09-07 14:07:46上传 ZIP文件 1.85MB 热度 32次
TextClassify文本分类系统适用于中文,英文文本分类。包括各个文本的关键词输出,可以控制关键词输出个数,也可以对关键词加入黑名单和白名单。关于TextClassify文本分类系统的改进:改进jieba中文分词词典改进黑名单:增加停用词改进白名单:增加专业词在TextProcess改进每一类text至多选FileInFolder个:理论上越多越好deleteN的选取:可以优化特征词的长度限定:unicode不过长,不过短特征词词典dict_size的选取:可以优化特征的改进多分类结合的算法改进
用户评论