1. 首页
  2. 编程语言
  3. Java
  4. 自然语言处理全集_代码结构说明.doc

自然语言处理全集_代码结构说明.doc

上传者: 2020-05-15 09:01:45上传 DOC文件 24.5KB 热度 24次
自然语言处理(汉语)算法实现,Java语言实现,经过优化,效率很高。主要包括: 1)汉语分词,采用ICTCLAS系统和Lucene+庖丁解牛系统 2)情感倾向性分析,包括基于统计学习的SVM算法,基于情感词典的词语权重算法,给出文档的情感权重和情感倾向 3)文本聚类,包括KMeas算法实现,文档向量建模,以及采用WekaAPI库效率比较 4)词语关系网络,包括词语距离计算,构建词语的近似程度,并刻画词语网络图 5)抽象摘要,采用TFIDF计算文档关键词进行摘要和关键字提取 经过部分优化,对于大数据量处理瓶颈的优化
下载地址
用户评论
码姐姐匿名网友 2020-05-15 09:01:45

骗积分的,里面的就是百度的废话

码姐姐匿名网友 2020-05-15 09:01:45

里面的内容.就那么几个关键字,感觉随便网上抄的,放这里感觉就像是骗积分的. 1)汉语分词,包括ICTCLAS系统,Lucene+庖丁解牛系统 2)情感倾向性分析,包括基于统计学习的SVM算法,基于情感词典的词语权重算法 3)文本聚类,包括KMeas算法,Weka API 库的学习与使用 4)词语关系网络,包括词语距离计算 5)抽象摘要,如采用TFIDF计算文档关键词