1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究一种基于词义和词频的向量空间模型改进方法.pdf

论文研究一种基于词义和词频的向量空间模型改进方法.pdf

上传者: 2019-09-04 10:57:12上传 PDF文件 1.25MB 热度 38次
文本内容较多时,传统的向量空间模型(VSM)建模可能产生维数爆炸现象,效率低下且难以保证分类效果。针对VSM高维现象,利用词义和词频降低文本建模维度的方法提高效率和准确度,提出一种多义词判别优化的同义词聚类方法,结合上下文判别多义词的词义后,根据特征项词义相似度进行加权,合并词义相近的特征项。新方法使特征向量维度大大降低,多义词判别提高了文本特征提取的准确性。与其他文本特征提取和文本分类方法进行比较,结果表明,该算法在效率和准确度上有明显提高。
用户评论