1. 首页
  2. 编程语言
  3. 其他
  4. .NET平台上的文件抽取框架toxy.zip

.NET平台上的文件抽取框架toxy.zip

上传者: 2020-05-15 01:48:16上传 NONE文件 45.3MB 热度 11次
toxy是.NET平台上的文件抽取框架,主要解决各种格式的内容抽取问题,比如pdf,doc,docx,xls,xlsx等,尽管听上去支持了很多格式,但它的使用却是极其方便的,因为Toxy把复杂的抽取流程透明化,Toxy的用户根本不用知道内容是怎么抽出来的,这就是Toxy的重要意义。   另外Toxy的一大目标是取代IFilter成为跨平台.NET数据抽取解决方案,即支持Linux上的Mono。目前所有的测试用例都可以跑在Mono上,但是有少数没有过,正在逐步改进。从另一个层面讲,Toxy能将文件数据变成统一的结构化数据。目前Toxy支持的结构有string –文本结构ToxyDo
下载地址
用户评论