1. 首页
  2. 数据库
  3. 其它
  4. WEB_KG:爬取百度百科中文页面抽取三元组信息建立中文知识图谱 源码

WEB_KG:爬取百度百科中文页面抽取三元组信息建立中文知识图谱 源码

上传者: 2021-02-15 14:29:57上传 ZIP文件 1.45MB 热度 6次
开源web知识图谱项目 爬取百度百科中文页面 解析三元组和网页内容 建立中文知识图谱 建立百科bot(重建中) 更新20200720 Windows上的部署参考,感谢LMY-nlp0701! 更新20191121 迁移代码到爬虫框架scrapy 优化了抽取部分代码 数据持久化迁移到mongodb 修复chatbot失败问题 开放neo4j后台界面,可以查看知识图谱成型效果 提示 如果是项目问题,请提问题。 如果涉及到不方便公开的,请发邮件。 ChatBot请访问 成型的百科知识图谱访问,用户名:neo4j,密码:123。效果如下: 环境 python 3.6 re:url正则匹配 scr
用户评论