1. 首页
  2. 数据库
  3. 其它
  4. nlp_consulting_project:Capgemini数据营 第1节:抓取 源码

nlp_consulting_project:Capgemini数据营 第1节:抓取 源码

上传者: 2021-04-08 18:08:55上传 ZIP文件 528.31MB 热度 9次
NLP咨询项目:为伦敦餐厅Bokan 37定义以数据为导向的策略 该项目有五个主要步骤: 数据采集 数据清理 词嵌入 主题提取 情绪分析 设置 git clone https://github.com/hehlinge42/nlp_consulting_project.git cd nlp_consulting_project pip install -r requirements.txt 建筑学 第一场:TripAdvisor的抓取工具 删除TripAdvisor用户在英国的网站( )上的餐厅以及其他用户做出的相关评论的工具。 cd scraper 请参阅文件夹中的专用自述文件。 第二节:数据清理器 清理和标记从TripAdvisor刮取的评论的工具。 cd cleaner 请参阅文件夹中的专用自述文件。 第三部分:特征嵌入器 将标记化评论嵌入到数字向量中的工具。 cd e
下载地址
用户评论