1. 首页
  2. 数据库
  3. 其它
  4. doc2vec:使用Doc2Vec嵌入的长文本表示和分类 源码

doc2vec:使用Doc2Vec嵌入的长文本表示和分类 源码

上传者: 2021-02-21 08:03:01上传 ZIP文件 12.96MB 热度 28次
Doc2Vec文本分类 文本分类模型,该模型使用gensim Doc2Vec生成段落嵌入,并使用scikit-learn Logistic回归进行分类。 数据集 25,000个IMDB电影评论,特别选择用于情感分析。 评论的情绪是二进制的(1表示肯定,0表示否定)。 与以下出版物相关联地收集了此源数据集: Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). "Learning Word Vectors for Sentiment An
下载地址
用户评论