1. 首页
  2. 数据库
  3. 其它
  4. MLClassifier:机器学习系统用于对OCR(ed)文档进行分类 源码

MLClassifier:机器学习系统用于对OCR(ed)文档进行分类 源码

上传者: 2021-03-12 12:50:07上传 ZIP文件 18.36KB 热度 3次
MLClassifier(SQL) 说明:纯SQL机器学习系统。 旨在在监督学习下处理OCR(ed)业务文档(发票,合同等)。 在MariaDB 10.5.4上测试。 系统假定您拥有将文档(例如PDF)转换为唯一(相关)单词列表的方式。 要求 像Linux一样运行Ubuntu或Debian: sudo apt install mariadb-server mariadb-client 安装方式 运行make install将架构部署到您MySQL / MariaDB服务器中。 该脚本将询问您数据库的名称。 make install 用法 学 通过将文档(例如发票)中出现的单词与提供的类别(例如公司名称)相关联来训练算法 Learn(d,c,w)存储过程将“单词”列表与已知的人类分类类别“关联”。 期望: 域-要处理的文档类型的通用名称(例如,发票,薪金收据等)。 类别-此
下载地址
用户评论