1. 首页
  2. 数据库
  3. 其它
  4. pdf4py:用Python 3编写的没有外部依赖关系的PDF解析器 源码

pdf4py:用Python 3编写的没有外部依赖关系的PDF解析器 源码

上传者: 2021-04-18 20:01:08上传 ZIP文件 11.17MB 热度 7次
pdf4py 用Python 3编写的PDF解析器,没有外部依赖关系。 软件包pdf4py允许用户通过访问其原子组件即PDF对象,以非常低的级别和非常灵活的方式来分析PDF文件。 所有这些都通过一个非常简单的API进行,可用于构建更高级别的功能(例如,文本和/或图像提取)。 特别是,它定义了Parser类,该类读取PDF文档的交叉引用表,并使用其条目使用户能够在文件中定位PDF对象,并将其解析为合适的Python对象。 免责声明:该软件包尚未达到稳定版本(> = 1.0.0)。 尽管解析器API非常简单,但它可能会突然从一个发行版更改为下一个发行版。 所有重大更改都将在发行说明中正确通知。 快速示例 这是有关如何使用pdf4py的快速演示。 您可以在找到更多信息。 >> > from pdf4py . parser import Parser >> > fp = open ( 't
下载地址
用户评论