Tesseract.js:纯Javascript多语言OCR 开源
Tesseract.js是流行的Tesseract OCR引擎的纯Javascript端口。 Tesseract.js的库支持100多种语言,自动文本方向和脚本检测,用于读取段落,单词和字符边界框的简单界面。 Tesseract.js可以在具有NodeJS的浏览器和服务器上运行。 Tesseract.js是一个JavaScript库,可从图像中获取几乎所有口头语言的单词。 Tesseract.js的主要功能(例如,识别,检测)采用图像参数,该参数应该类似于图像。 根据是从浏览器运行还是通过NodeJS运行,所谓的“类似图像”有所不同。
下载地址
用户评论
通过Tesseract.js,我们可以在浏览器上直接进行OCR,无需安装额外的软件,非常方便。
这个文件提供了一个非常有用的纯Javascript多语言OCR解决方案。
Tesseract.js的开源性质使其更具灵活性和可定制性,能够满足各种不同的OCR需求。