MovieClassifier v1.1基于KNN算法的Java电影情节分类程序
MovieClassifier_v1.1 是用 Java 编写的程序,用于将文本形式的给定 电影情节 分类为 动作、浪漫、喜剧 等类型。该程序基于 KNN(K-Nearest Neighbor)算法,可以准确地将电影情节分类为预定义的几种流派。
操作流程:
-
我们从文件中获取包含数千个电影情节的文本数据,文件中包含了来自 IMDB 网站的每部电影名称及其流派。
-
将每个电影情节提取到单独的文件,并根据流派进行分类存放在不同文件夹中。
-
创建不同流派的文件(例如 action.txt、comedy.txt 等),并收集该流派下的所有电影情节。
-
使用 R 脚本对这些数据进行处理,最终生成可供 KNN 算法分类的训练集。
下载地址
用户评论