1. 首页
  2. 考试认证
  3. 其它
  4. automatic tag recommender stack overflow 使用Apache Spark、Lucene ...

automatic tag recommender stack overflow 使用Apache Spark、Lucene ...

上传者: 2024-10-10 20:13:20上传 ZIP文件 45.23KB 热度 3次
本项目涉及4个模块。 1--数据清洗模块- Python 2--数据索引和分割模块-java-lucene 3-- SVM分类器模块- scala - spark 4--混合Kmeans + SVM分类器模块- scala - spark最后3个模块由根目录驱动第1步:从下载stackoverflow数据第2步:将posts.xml和tags.xml放在中,并从同一目录运行python脚本。第3步:使用命令行参数-index 运行模块2。它将索引/data中的所有问题并将索引文件放在/indexDir第3步:使用参数-segmentFullData 再次运行模块2。它将执行所需
下载地址
用户评论