1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 微博文本聚类中特征扩展策略研究.pdf

论文研究 微博文本聚类中特征扩展策略研究.pdf

上传者: 2020-07-16 20:39:32上传 PDF文件 881.22KB 热度 20次
针对微博文本高维、稀疏的特点,比较基于同义词词林等外部知识库的文本扩展策略,利用Word2vec训练微博语料,并构建微博上下文相关词词表,通过种子词表和微博标签信息去扩展微博文本流中的关键词,最后提出了提取微博文本关键词及区分词向量中相似词和相关词的方法。实验结果证明,微博短文本经过Word2vec词向量相关词及微博标签扩展后,其聚类效果有了明显提高。
用户评论