1. 首页
  2. 课程学习
  3. 讲义
  4. 基于 LDA 模型的博客垃圾评论发现

基于 LDA 模型的博客垃圾评论发现

上传者: 2020-01-05 19:28:24上传 PDF文件 1014.59KB 热度 36次
Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重要问题。该文首先借鉴处理垃圾邮件的方法,针对Blog本身的特点,使用规则初步过滤垃圾评论,然后对剩余评论,利用LatentDirichletAllocation(LDA)这种能够提取文本隐含主题的产生式模型,对博客中的博文进行主题提取,并结合主题信息进行判断,从而识别Blog空间的垃圾评论。
用户评论
码姐姐匿名网友 2020-01-05 19:28:24

看下。。。。。