1. 首页
  2. 编程语言
  3. Python
  4. 搜狐新闻数据分类处理

搜狐新闻数据分类处理

上传者: 2024-04-22 05:38:58上传 PY文件 3.19KB 热度 7次

共有24000条训练样本,12个分类,每个分类2000条样本。测试集包含12000条样本,同样是12个分类,每个分类1000条样本。提供的代码演示在.py文件中,不含数据集文本。数据集可在博主主页下载:sohu_test.txt、sohhu_train.txt、sohu_train_cut.txt以及stopwords.txt。

用户评论