1. 首页
  2. 人工智能
  3. 机器学习
  4. sklearn文本分类数据包20newsgroups20newsbydate

sklearn文本分类数据包20newsgroups20newsbydate

上传者: 2020-05-13 12:46:10上传 GZ文件 13.79MB 热度 26次
20newsgroups数据集有三个版本。第一个版本19997是原始的并没有修改过的版本。第二个版本bydate是按时间顺序分为训练(60%)和测试(40%)两部分数据集,不包含交叉文档和新闻组名(新闻组,路径,隶属于,日期)。第三个版本18828不包含交叉文档,只有来源和主题名。
下载地址
用户评论