1. 首页
  2. 编程语言
  3. Java
  4. apache tika 1.13 源码及构建好的库(part 1 )

apache tika 1.13 源码及构建好的库(part 1 )

上传者: 2019-04-10 11:15:44上传 RAR文件 180MB 热度 25次
Apache Tika 利用现有的解析类库,从不同格式的文档中(例如HTML, PDF, Doc),侦测和提取出元数据和结构化内容。 功能包括: 侦测文档的类型,字符编码,语言,等其他现有文档的属性。 提取结构化的文字内容。 该项目的目标使用群体主要为搜索引擎以及其他内容索引和分析工具。编程语言为Java.
用户评论