基于yolo3与crnn的中文自然场景文字检测与识别技术
采用yolo3与crnn技术实现了中文自然场景文字的高效检测与识别。我们的系统具备文字方向检测功能,支持0、90、180、270度的文字方向检测,同时兼容dnn和tensorflow技术。该系统还支持多种训练方式,包括darknet、opencv dnn和keras,可以用于不定长OCR训练,覆盖英文和中英文等多种语言。crnn和dense ocr识别及训练功能也得到了全面支持,并引入了pytorch转keras模型代码,使得模型之间的转换更加灵活。我们新增了对身份证和火车票结构化数据的识别功能,进一步扩展了应用领域。此外,我们对语音模型进行了修正,提高了OCR识别结果的准确性。CNN+ctc模型的引入使得DNN模块可以更灵活地调用OCR,而且在单行图像平均处理时间方面更是达到了惊人的0.02秒以下。
用户评论