特征:从自然历史注释中提取信息 源码
性状数据库项目 特质 这是所有客户Traiter项目( , 等)使用的基本Traiter信息提取/数据挖掘库。 它本身不包含可运行的代码。 挖掘了一些文献: 包含有关物种描述的研究论文的PDF。 包含物种分布数据的PDF。 实地记录和物种描述的数据库下载。 博物馆标本的图像。 我们目前正在从图像中的标签中提取数据。 从网站上抓取的包含物种正式描述(治疗)的数据。 物种描述和分布数据的PDS图像。 数据收集说明的图像。 注意所有术语,特征和提取方法对于要开采的文献都是唯一的,因此该存储库仅包含真正通用的术语,特征或就此而言在许多研究领域中使用的功能。 解析策略 让专家确定相关
用户评论