1. 首页
  2. 安全技术
  3. 其他
  4. 文本情感分类影评数据IMDB预处理RNN LSTM

文本情感分类影评数据IMDB预处理RNN LSTM

上传者: 2023-01-03 15:02:30上传 PY文件 1.2KB 热度 15次
对下载的IMDB数据集中的test和train分别进行预处理从而方便后续模型训练代码为PreProcess.py.预处理主要包括大小写转化特殊字符处理stopwords过滤分词最后将处理后的数据存储为CSV格式以方便后续调试.借用了nltk的stopwords集用来将像i you is之类的对分类效果基本没影响但出现频率比较高的词从训练集中清除.
用户评论