sempubchallenge2014task1语义发布挑战任务1的解决方案
如何配置和运行解析器
Required模块:需要安装以下Python模块:RDFLib,PDFMiner,PyPDF2。
Configuration:所有配置设置都应该在config.py文件中,该文件应该通过重命名从config.py.example创建。
Input urls:输入url列表被设置为input_urls变量的Python列表。
DBpedia数据集(包含国家和大学):解析器使用提取国家和大学的名称,以及它们在DBpedia中的URI。共有三个选项:
-
使用原始数据集。默认情况下,什么都不应该配置。
-
要使用,则sparqlstore['dbpedia_url']应更改为http://lod.openlinksw.com/sparql。
-
要使用本地转储,这需要进行相应的配置。
下载地址
用户评论