1. 首页
  2. 移动开发
  3. 其他
  4. 基于海量煤炭采集文本数据的可扩展SVM算法的研究与应用

基于海量煤炭采集文本数据的可扩展SVM算法的研究与应用

上传者: 2020-08-18 15:31:05上传 PDF文件 780.76KB 热度 17次
文本分类是指在给定的分类系统下,根据文本的内容或属性,将大量文本归到一个或多个类别的过程。随着煤炭产业的高速发展,煤炭数据库中保存了大量煤炭采集文本数据,针对如此大规模的文本信息,传统的SVM算法不能很好地对大规模海量煤炭文本数据进行有效的处理。文中基于现有流行的Hadoop分布式计算平台,提出了分布式SVM文本分类算法。通过实验表明,文中提出的算法能够明显减小文本分类时间,并且具有很好的可扩展性。
下载地址
用户评论