怎么把pdf里的文字提取出来?

如题所述

可以通过adobe acrobat professional使用OCR识别文本来解决。

1、打开要识别的PDF,如果该PDF没有加密,那么点击“编辑-编辑文本和图像”或者在任意页面鼠标右击,选择“编辑图像”,就可以进行OCR识别了。

2、进行第一步之后,默认执行的单页的识别,但是如果要识别整个PDF文件,点击图中右下角扫描文档下的“设置”。

3、在弹出的窗口中勾选“所有页面均可编辑”,点击确定,再点击编辑图像时,就可以全篇识别了。

4、最后就完成了。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2024-01-17

作为一个职场人,处理PDF文件已经成为我们日常生活的一部分。有时候我们需要拆分、合并,或者提取其中的页面或文字。那么,有没有一种简单、高效的方法呢?

其实,腾讯文档不仅仅是一个简单的文档编辑工具,它更是一个隐藏的魔术师,【工具箱】中的【PDF工具】能够轻松应对各种PDF处理需求。

把PDF其中的某几页识别为文字。

1、打开“PDF提取文字”,点击“选择文件”。

2、选择聊天文件或腾讯文档里的PDF,点击“确定”按钮。

3、选择要提取的页面,提取完成后,即可复制内容。