1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 文本分类中信息增益特征选择方法的研究.pdf

论文研究 文本分类中信息增益特征选择方法的研究.pdf

上传者: 2020-07-22 09:29:32上传 PDF文件 506.46KB 热度 30次
分析了传统信息增益(IG)特征选择方法忽略了特征项在类间、类内分布信息的缺点,引入类内分散度、类间集中度等因素,区分与类强相关的特征;针对传统信息增益(IG)特征选择方法没有很好组合正相关特征和负相关特征的问题,引入比例因子来平衡特征出现和不出现时的信息量,降低在不平衡语料集上负相关特征的比例,提高分类效果。通过实验证明了改进的信息增益特征选择方法的有效性和可行性。
用户评论