1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究不均衡数据在股票研报分类中的应用.pdf

论文研究不均衡数据在股票研报分类中的应用.pdf

上传者: 2019-10-23 17:56:44上传 PDF文件 1.1MB 热度 22次
股票研报是由金融行业分析师对股票相关新闻作出的分析和评价,它从专业角度分析此类新闻是否会对某股票的未来走势产生影响,并提出专业投资建议,往往比论坛分析更具权威性。然而,各类别研报数量之间的严重不均衡性致使常规的SVM分类效果较差。为提高分类效果,提出一种新的不均衡数据分类方法。在文本特征项选择方面采用组合特征思想以选择更具语义信息的特征短语,并改进CHI统计以提高对少数类样本特征项的选择,然后设计一个基于SVM聚类的边界自适应层次欠采样算法对多数类样本进行层次欠采样。实验结果表明,该方法能够在不影响多数类分类的基础上对少数类的分类效果有较为明显的提升。
下载地址
用户评论