1. 首页
  2. 数据库
  3. 其它
  4. 巴特勒实验室迷你项目 源码

巴特勒实验室迷你项目 源码

上传者: 2021-02-08 06:58:18上传 ZIP文件 257.88KB 热度 21次
巴特勒实验室迷你项目 该程序的作用: 进入当前工作目录中名为“ in_resume_samples”的简历文件夹,将其拆分为可读的字符串,使用regex和spaCy搜索信息(它们的名称,电子邮件以及他们可能知道的编码语言),并将该数据导出到当前工作目录中名为“ resumeInfo”的csv文件。 该程序中的文件: pdfExtraction.py-从pdf提取信息并将数据导出到csv文件。 matchPatterns.py-使用spaCy令牌定义匹配模式,以便找到编程语言。 可以在文件本身中找到有关这两个文件的更多信息。 运行程序的重要说明: 用Python 3.9编写,可能无法
用户评论