BTM算法java实现主题建模
ABitermTopicModelforShortTexts提出了一个较为新颖的思路。试想我们人眼分辨短文本的过程,我们并不是孤立的看每个词是否出现,而是要关注,是否某些词一起出现了。这个特征更强,所以区别性也更高。ABitermTopicModelforShortTexts提出的模型BTM类似如此。他用一个窗口在文档内滑动(如果文本太短,或许就只有窗口了),然后将窗口内的两个词作为一个共现词对,每个词对的生成过程是从全局的主题分布中取一个词,然后从主题-词分布取两个词。
下载地址
用户评论
设置好参数可以使用,正在学习,谢谢分享!
建议下载官网的
好坑,花了积分,可是下载的资源不能用,作者没给全呀