doc2text:批量检测文本块和OCR扫描不良的PDF。 Python模块可通过pip获得源码

Name: doc2text:批量检测文本块和OCR扫描不良的PDF。 Python模块可通过pip获得 源码
Rating: 4.5 (26 reviews)
Author: compliance981

上传者：compliance981 2021-02-22 22:40:51上传 ZIP文件 23.95KB 热度 26次

doc2text doc2text通过修复常见的扫描错误来提取高质量的文本发展文本语料库可能会给屁股带来巨大的痛苦。由于科学家被锁定在扫描不良的pdf中,因此我们对许多文本数据感兴趣。这些扫描可能会步履蹒跚,分辨率差,需要帮助...如果您在不修正这些错误的情况下对这些扫描进行OCR,OCR的结果就不会那么好。创建doc2text是为了帮助研究人员修复这些错误并尽可能从pdf中提取最高质量的文本。 doc2text是超级duper alpha atm doc2text是在Ubuntu 16.04 LTS Xenial Xerus上开发和测试的。我们暂时不假装为所有操作系统提供服务,因

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

doc2text批量检测文本块和OCR扫描不良的PDF Python模块可通过pip获得源码

doc2text doc2text通过修复常见的扫描错误来提取高质量的文本发展文本语料库可能会给屁...

大小：24KB | 2021-02-22 22:40:51
metaparser INSTEAD模块可通过文本输入创建游戏源码

metaparser:INSTEAD模块可通过文本输入创建游戏

大小：1.8MB | 2021-04-07 08:24:55
pytorch.ctpn pytorchctpn文本检测ocr文本检测源码

文字检测-ctpn-pytorch 我关于CTPN 结语 Ctpn适用于水平文本,但不适用于倾斜和弯...

大小：50.29MB | 2021-05-05 23:16:47
图片批量转文本OCR

Image batch to text (OCR)

大小：0B | 2019-06-22 16:43:33
plugin auto install此模块已移动现在可通过rollupplugin auto installhttps获得源码

感动此模块已移动,现在可以在。请更新您的依赖关系。该存储库不再维护。 @ rollup / plu...

大小：3KB | 2021-03-31 18:52:51
通过IP扫描获得Dns

通过多线程实现一个通过IP扫描获得主机的Dns的一个小工具,自己完成的

大小：44KB | 2020-09-18 10:35:22
python通过pil模块获得图片exif信息的方法

主要介绍了python通过pil模块获得图片exif信息的方法,实例分析了Python中pil模块的...

大小：25KB | 2020-09-25 07:02:59
python通过exifread模块获得图片exif信息的方法

主要介绍了python通过exifread模块获得图片exif信息的方法,实例分析了Python操作...

大小：24KB | 2020-10-03 00:21:13
Python和OpenCV实现文本方向检测、OCR识别和图像转字符画

该资源包含Python和OpenCV实现的各种功能，包括文本方向检测、OCR识别和图像转字符画。其中...

大小：12.09MB | 2023-03-27 19:41:48
OCR扫描图书文本识别

OCR扫描图书文本识别KEY,用在ABBYYFinereader破解

大小：0B | 2020-01-29 16:19:35
教你怎么用pip安装Python模块.doc

centos7.4 pip下载会报错 command not found，此教程教你一步一步下载完...

大小：54KB | 2020-07-19 06:14:36
TEXT文本批量转shapefile文件

能够将以文本格式组织的坐标转换为shape格式，支持自定义转换坐标起始行、分隔符，指定X,Y坐标的列...

大小：0B | 2019-05-06 20:25:53
text2text为您的文本生成问题和摘要源码

Text2Text:为您的文本生成问题和摘要输入您的文字并获得问题和总结! 引文要引用此工作,请...

大小：54KB | 2021-02-08 07:32:31
text analyzer profanityfilter微服务用于从文本中过滤不良语言源码

text-analyzer-profanityfilter:微服务,用于从文本中过滤不良语言

大小：12KB | 2021-04-07 08:21:32
Python SegLink通过linkingsegments进行文本检测

SegLink - 通过linking segments进行文本检测

大小：61KB | 2020-08-30 05:13:09
Python优化中文OCR文本识别效率的pse.pyd模块

Python中，通过引入pse.pyd模块，成功构建了一套快速高效的中文文字识别（OCR）系统。该模...

大小：44.21KB | 2023-11-23 23:39:09

doc2text:批量检测文本块和OCR扫描不良的PDF。 Python模块可通过pip获得 源码

doc2text:批量检测文本块和OCR扫描不良的PDF。 Python模块可通过pip获得源码