如何把pdf文件转换成TXT文档

 时间:2018-06-30  贡献者:xx兵11

导读:pdf文件怎么转换为txt格式呢,如何把 pdf 文件转换成 txt 文档 现在是电子书的时代,很多朋友的电子设备只支持 txt 格式的文件,可是找到的一些不 错的书籍却是 pdf 的格式。怎么把 pdf 格式转成 txt 格式呢?近来

pdf文件怎么转换为txt格式呢
pdf文件怎么转换为txt格式呢

如何把 pdf 文件转换成 txt 文档 现在是电子书的时代,很多朋友的电子设备只支持 txt 格式的文件,可是找到的一些不 错的书籍却是 pdf 的格式。

怎么把 pdf 格式转成 txt 格式呢?近来,总有朋友问我这个问题。

这里把我的方法写下来,分享给朋友们,希望能帮到大家。

更希望起到抛砖引玉的作用,有 更好的方法被分享出来。

工欲善其事,必先利其器,所以,需要先安装 pdf 文档的专用软件,推荐使用 Adobe Acrobat 7 Professional 或者 Adobe Acrobat 9 Professional 版本。

不要使用 Adobe Acrobat reader, 因为功能太少。

软件网上一搜,可以随便找到。

如果是由 word 文件转成的 pdf 文件,这个比较简单。

打 开 pdf 文 档 , 选 择 文 件 —— 另 存 为 , 如 下 图 :在弹出的另存为对话框中,保存类型——纯文本。

就可以了。

如下图:1/7

如果没法直接保存成纯文本,报 ASCII 码错误的话,可以先保存为 microsoft word 文档, 再由 word 文档转换成 txt 格式。

如果 pdf 文档是由扫描后的图片制作而成的, 用上述方法就无法直接转换成 txt 格式了。

需要用以下方法。

打开 pdf 文档,选择文件——另存为——保存类型选择 jpeg 图片格式。

如下图:2/7

存为 jpeg 格式的图片之后,需要安装 OCR 识别软件。

推荐使用清华紫光 OCR 或者 汉王 OCR 软件。

软件网上都可以免费下到。

我使用的是汉王 OCR 8.0 。

安 装 好 软 件 之 后 , 运 行 OCR 软 件 。

选 择 文 件 —— 打 开 图 像 , 如 下 图 :3/7

找到图片保存目录,打开从 pdf 文件转换成的图片。

图片文件打开以后,选择识别——开始识别:4/7

识别完成后界面如下图:上半部分是识别出来的文字, 下半部分是原稿。

因为识别软件以及图片清晰度的原 因,有些字会与原稿有误,需要校对。

校对过程中,如果原稿字太小,看不清楚,可以选择5/7

放大原稿操作。

如下图:校对完成,选择输出——到指定格式文件,保存成 txt 格式就可以了。

如下图:6/7

至此,很轻松的,txt 格式的文档就转换好了。

最后说一句,校对很重要,因为需要与原稿对比着认真的看一遍。

仔细才能做到无 误。

所以这个过程很花时间的。

希望大家从网上分享到别人上传的 txt 格式的电子书,在享 受阅读的快乐与愉悦的同时,请怀着感恩的心,感谢发帖者。

因为这也是别人的劳动结晶。

7/7