1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究融合词向量特征的双词主题模型.pdf

论文研究融合词向量特征的双词主题模型.pdf

上传者: 2020-05-18 04:55:38上传 PDF文件 1013.26KB 热度 27次
针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-BTM。该模型引入潜在特征模型以利用丰富的词向量信息弥补内容稀疏,在改进的生成过程中每个双词的词汇的生成受到主题—词汇多项分布和潜在特征模型的共同影响。模型中的参数通过吉布斯采样算法进行估计。在真实的短文本数据集上的实验结果表明,该模型能结合外部通用的大规模语料库上已训练好的词向量挖掘出语义一致性显著提升的主题。
用户评论