pdf2htmlEX:在不丢失文本或格式的情况下将PDF转换为HTML 源码
pdf2htmlEX 与上游pdf2htmlEX的区别: 这是我的pdf2htmlEX分支,其目的是允许进行开放式协作以帮助保持项目活跃。 其他分支也进行了许多更改和改进: 修复了许多错误,大部分是边缘情况 集成最新的开罗代码 超出源建设 重写处理模糊/部分模糊的文本-现在更加准确 对透明文本的一些支持 DPI设置的改进-夹紧DPI以确保输出图形不会太大 --correct-text-visibility跟踪每个字符的4个采样点的可见性(当前,字符边界框的4个角,已稍微插入)以确定可见性。 现在有两种模式。 1 =已处理完全遮挡的文本(即未放入HTML层)。 2 =处理了部分遮挡的文本。
用户评论