Stopwords中文停用词表合集

上传者：baidu_13347 2025-05-31 20:04:26上传 ZIP文件 13.79KB 热度 50次

中文项目里要做文本？你八成得先一遍停用词。stopwords-master这个资源就挺适合你，直接打包了哈工大、百度、川大几套常用的中文停用词表，挺全的，免去你到处找的麻烦。

哈工大的词表，偏学术风，适合偏向语言的项目；百度那套更接地气，挺适合内容运营、搜索优化这些场景；川大的也不错，偏中性，平衡了一下覆盖面和精准度。

压缩包叫stopwords-master.zip，你解压之后能看到好几个.txt格式的词表文件，用起来挺方便，Python 项目里用jieba或者nltk一引入就能跑，连预的代码都不用怎么改。

比如你在做关键词提取，直接加载停用词列表，用jieba.analyse.extract_tags就能排除那些“的”“是”“在”这种干扰词，关键词一下子清晰多了。

文件我翻了一下，基本没太多水分，而且每个词表都注明了来源，像哈工大停用词表.txt、baidu_stopwords.txt这种，按需选就行。Github 上多 NLP 项目也用这一套，稳定性和兼容性都还不错。

对了，这里可以下载最全打包版，有兴趣你也可以分开下载不同版本试试看，像哈工大、川大的单独资源也都挂着。

如果你做的是爬虫、情感、搜索推荐这些中文相关的应用，建议直接把它塞进你的预流程，效果还挺。要是词表不太适合你项目的语境，删删改改也不难。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

Stopwords中文停用词表合集

中文项目里要做文本？你八成得先一遍停用词。stopwords-master这个资源就挺适合你，直接打...

大小：13.79KB | 2025-05-31 20:04:26
中文停用词表stopwords.txt

简体中文停用词表，可以作为词云的数据清理用。里面的词在任何场景中都是高频词，并且没有实际的含义，在应...

大小：0B | 2019-05-14 02:22:37
中文停用词stopwords

中文停用词,用于中文语言处理,信息检索等,902个

大小：5KB | 2020-08-17 08:00:17
stopwords中文停用词

stopwords中文停用词，常用于网络爬虫抓取数据后进行数据整合，纯中文

大小：0B | 2019-07-27 11:22:26
停用词词表中文停用词

这里面搜集了所有的中文停用词，希望能对做搜索引擎的朋友有用

大小：0B | 2020-01-05 20:19:16
中文停用词表 英文停用词表 中英文停用词表

大小：0B | 2018-12-07 20:45:51
哈工大停用词表hit_stopwords

哈工大停用词表hit_stopwords

大小：3KB | 2021-04-23 17:31:39
中文停用词表

大小：0B | 2019-04-13 12:09:04
中文分词停用词StopWords

中文分词中常用的停用词StopWords集合。

大小：0B | 2019-05-31 07:00:31
中文停用词词表

大小：0B | 2019-03-28 03:12:18
常用停用词哈工大停用词表百度停用词表四川大学停用词表中文停用词表

包括哈工大停用词表、百度停用词表、四川大学机器智能实验室停用词库、中文停用词表,适合于文本预处理阶段...

大小：14KB | 2020-12-23 07:36:23
下载最新简体中文停用词表stopwords.txt

最新简体中文常见停用词表：stopwords.txt

大小：0B | 2020-03-10 14:38:44
百度停用词表baidu_stopwords

百度停用词表baidu_stopwords

大小：5KB | 2021-04-23 17:31:44
中文停用词表.txt

中文停用词，NLP分词参考，相对比较全的一版

大小：0B | 2019-10-03 21:11:05
中文常见停用词表

在自然语言（NLP）领域，中文停用词表是一项基础工具，广泛应用于文本、信息检索和机器学习等任务。停用...

大小：9.31KB | 2025-05-23 08:59:17
常用中文停用词表

常见中文停用词表。包含标点符号、数字，某些英文单词等。

大小：0B | 2019-06-05 10:10:57