plagiarism_detector_udacity:我的工作 源码
抄袭项目,机器学习部署 该存储库包含用于使用AWS SageMaker部署窃检测器的代码和相关文件。 项目概况 在这个项目中,您将负责构建a窃检测器,该检测器将检查文本文件并执行二进制分类。 根据该文本文件与提供的源文本的相似程度,将该文件标记为抄袭或不抄袭。 检测窃是一个活跃的研究领域。 这项任务很艰巨,解释的答案和原始作品之间的区别通常不太明显。 该项目将分为三个主要笔记本: 笔记本1:数据探索 加载of窃文本数据的语料库。 探索现有的数据功能和数据分布。 这第一台笔记本是不是在你的最终项目要求提交的。 笔记本2:功能工程 清理并预处理文本数据。 定义用于比较答案文本和源文本的
用户评论