pdfocr:使用cuneiform OCR软件将文本添加到PDF文件 源码
pdfocr pdfocr将OCR文本层添加到扫描的PDF文件中,以便对其进行搜索。 当前,它依赖Ruby 1.8.7或更高版本,并使用ocropus,楔形文字或tesseract来执行OCR。 使用 要使用,请运行: pdfocr -i输入.pdf -o输出.pdf 有关更多详细信息,请参见联机帮助页。 依存关系 pdfocr需要tesseract和hocr2pdf。 这些可以通过安装软件包tesseract-ocr,tesseract-ocr-eng(或您需要的其他语言)以及分发中的确切映像来提供。 学分 pdfocr由撰写 pdfocr托管在 Christian Pietsch添
下载地址
用户评论