基于Hadoop架构的文本分类算法
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征选择算法(训练集特征选择)。
下载地址
用户评论
CSDN的60秒限制实在是醉了。。。 算法不错,值得学习。
还不错的资源,先学习再说
可能好用吧,但发现不是我需要的,不过还是不错
程序好像无法运行,提供一个搭配环境的文档会更好点
程序不全,连main都没有,无法运行