1. 首页
  2. 编程语言
  3. VB
  4. 文本分类实验报告

文本分类实验报告

上传者: 2020-05-04 07:55:40上传 DOC文件 6.23MB 热度 14次
本报告包括完整的文本分类处理过程,包括24万搜狗预料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
用户评论