微博链接https://weibo.com/1727858283/4954051088744878Date我的评论@我的Notion标签宝玉xp2023-10-07 03:41:24#开源项目推荐#:pdf2htmlEX 这应该是效果相当好的一个PDF转HTML程序,生成的结果和原始PDF几乎一模一样。 其背后是利用的Chrome Headless,让Chrome渲染PDF,再导出成HTML,甚至图片都转成了 base64 字符,所以一个网页就可以包含完整的文本、字体和图片等内容 github.com/pdf2htmlEX/pdf2htmlEX