1. 首页
  2. 数据库
  3. 其它
  4. 电影评论情感分析:训练了一种二进制分类模型可基于该评论中使用的单词来预测电影评论的情绪 源码

电影评论情感分析:训练了一种二进制分类模型可基于该评论中使用的单词来预测电影评论的情绪 源码

上传者: 2021-02-18 17:14:15上传 ZIP文件 153.89MB 热度 11次
1引言 该项目致力于利用成千上万条带有标签的电影评论来训练二进制分类模型,该模型将纯粹基于评论中的单词来预测新电影评论的情绪。 为了完成此任务,此存储库中包含以下文件: alldata.tsv :此文件包含评论的完整数据集以及用于训练和测试模型的相关标签。 create_vocab.R :这是用于从训练数据生成词汇表的脚本。 该词汇表中的术语用于训练逻辑回归分类器。 myvocab.txt :这是从create_vocab.R脚本生成的选定术语的列表。 mymain.R :此文件包含用于训练模型并评估测试集上的结果(使用AUC)的代码。 eval_code.R :这是用于为五个分割
用户评论