stopwords.txt
该资源是本人博客《文本聚类(一)—— LDA主题模型》中所使用的停用词表,该停用词表基于百度停用词表,并在此基础上加入了一些分词后产生的单个字以及数字信息等内容。因此,这个停用词表更加适合特定文本分析任务,不建议作为通用性质的停用词表使用。如果你需要不同版本或更广泛的停用词表,可以参考以下链接:分词停用词表、中文分词最全停用词表以及多种中文分词停用词表。这些资源提供了丰富的选择,可以满足不同的文本处理需求。
用户评论