1. 首页
  2. 移动开发
  3. 其他
  4. 概率主题模型在文本分类中的应用研究

概率主题模型在文本分类中的应用研究

上传者: 2020-08-11 16:35:16上传 KDH文件 1.08MB 热度 16次
所属领域:数据挖掘、机器学习、文本分类 数据偏斜和噪声数据是文本自动分类应用中经常遇到的问题。在数据偏斜的 情况下,样本无法准确反映整个空间的数据分布,分类器容易受到大类的影响而忽 略小类。大多数分类算法都是面向均匀分布数据提出的,对于数据偏斜的情况, 仅利用传统的分类方法并不能取得理想的效果。另一方面,分类器的质量很大程 度上取决于训练文本集的质量。一般说来,训练文本集类别越准确、内容越全面, 得到的分类器质量就越高。但是在实际应用中,这种全面准确的训练文本集是很 难得到的,尤其是在数据规模很大的情况下,更是如此。在真实的文本分类应用 中,训练数据一般都不可避免的含有噪声,这些噪声样本将对最
用户评论
码姐姐匿名网友 2020-08-11 16:35:16

看了一下,不错,非常感谢

码姐姐匿名网友 2020-08-11 16:35:16

这个论文写的不错,但是我没有用到论文的相关方法。。

码姐姐匿名网友 2020-08-11 16:35:16

我正在研究LDA模型,这篇文章对我很有用,谢谢分享。