PDF 文件文本内容提取的设计与实现 上传者:kimspan 2020-09-19 15:19:05上传 APPLICATION/PDF文件 414KB 热度 12次 PDF 文件格式是面向显示的,本身缺乏语义信息,如果不将其内容提取出来,就不能实现基于语义的查询。本文设计并实现了一款PDF 内容提取的工具,首先对PDF 文件进行了文本解析,将正文内容字符串流从源码中提取出,并对提取后的字符串流利用解密算法进行解密,然后利用Filter 解码算法进行解码,最后将PDF 的文本内容从解码后的字符串流中提取出。结果表明本文提出的方法不但能够非常准确的实现PDF 文件格式的转换,而且可以非常方便的嵌入到搜索引擎中。 下载地址 用户评论 更多下载 下载地址 立即下载 收藏 腾讯 微博 用户评论 码姐姐匿名网友 2020-09-19 15:19:05 原理大家都知道,具体的实现=。=各种复杂情况要考虑啊 发表评论 kimspan 资源:4 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com
原理大家都知道,具体的实现=。=各种复杂情况要考虑啊