1. 首页
  2. 数据库
  3. 其它
  4. pdfocr:使用cuneiform OCR软件将文本添加到PDF文件 源码

pdfocr:使用cuneiform OCR软件将文本添加到PDF文件 源码

上传者: 2021-02-01 22:53:01上传 ZIP文件 5.45KB 热度 15次
pdfocr pdfocr将OCR文本层添加到扫描的PDF文件中,以便对其进行搜索。 当前,它依赖Ruby 1.8.7或更高版本,并使用ocropus,楔形文字或tesseract来执行OCR。 使用 要使用,请运行: pdfocr -i输入.pdf -o输出.pdf 有关更多详细信息,请参见联机帮助页。 依存关系 pdfocr需要tesseract和hocr2pdf。 这些可以通过安装软件包tesseract-ocr,tesseract-ocr-eng(或您需要的其他语言)以及分发中的确切映像来提供。 学分 pdfocr由撰写 pdfocr托管在 Christian Pietsch添
下载地址
用户评论