1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究不均衡数据集上文本分类方法研究.pdf

论文研究不均衡数据集上文本分类方法研究.pdf

上传者: 2020-03-02 12:48:53上传 UNKONW文件 500kb 热度 34次
文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题。从特征选择优化和分类器性能提升两方面出发,提出了一种组合的不均衡数据集文本分类方法。在特征选择方面,综合考虑特征项与类别的正负相关特性及类别区分强度对传统CHI统计特征选择方法予以改进。在数据层上,采用数据重取样方法对不均衡训练语料的不平衡性过滤减少其对分类性能的影响。实验结果表明该方法对不均衡数据集上文本可达到较好分类效果。
下载地址
用户评论