grobid:一种用于从学术文档中提取信息的机器学习软件 源码
GROBID GROBID文档 请访问以获取更多详细信息。 概要 GROBID(或Grobid,但不是GroBid或GroBiD)表示书目数据的生成。 GROBID是一个机器学习库,用于将原始文档(例如PDF)提取,解析和重组为结构化XML / TEI编码的文档,尤其侧重于技术和科学出版物。 最早的发展始于2008年,是一种业余爱好。 在2011年,该工具已以开源形式提供。 自开始以来,作为副项目的GROBID工作就一直稳定,并有望继续进行。 可以使用以下功能: 从PDF格式的文章中提取标题并进行解析。 这里的摘录涵盖了通常的书目信息(例如标题,摘要,作者,隶属关系,关键字等)。 从.
用户评论