如何将PDF格式转换为WORD文档

 时间:2020-08-15  贡献者:322fk.com

导读:pdf文件如何转换成word,如何将 PDF 格式转换为 WORD 文档经常在 PDF 形式上看到有好的文件时,想把它拿出来,但是却是 不行,所以第一步就是找一下有没有可以到 PDF 格式与 WORD 文档的转 换,在网上找了一下,原

pdf文件如何转换成word
pdf文件如何转换成word

如何将 PDF 格式转换为 WORD 文档经常在 PDF 形式上看到有好的文件时,想把它拿出来,但是却是 不行,所以第一步就是找一下有没有可以到 PDF 格式与 WORD 文档的转 换,在网上找了一下,原来还真的有很多,现在把这些方法也传上来 , 不过也发现一个问题,就是如果 PDF 本身是图片的话,那也没办法转 换,不知道还有没有其它方法可以把 PDF 图片格式也转换过来那就最 好 了,不过还是希望 AdobeAcrobat 公司在开发上能够和 OFFICE 相结合,那对我们来说使用就更方便了.1 实现工具:Office2003 中自带的 MicrosoftOfficeDocumentImaging 应用情景: 目前国外很多软件的支持信息都使用 PDF 方式进行发 布,如果没有 Adobe Reader,无法查看其内容,如果没有相关的编辑软件 又无法编辑 PDF 文件。

转换为 DOC 格式则可以实现编辑功能。

尽 管有些软件也可 以完成 PDF 转换为 DOC 的工作,但很多都不支持中文,我们利用 Office2003 中的 MicrosoftOfficeDocument Imaging 组件来实现这一要求最为方便。

使用方法: 第一步:首先使用 AdobeReader 打开待转换的 PDF 文件,接下来1

选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机” 栏中的“名称”设置为“MicrosoftOfficeDocumentImage Writer” , 确认后将该 PDF 文件输出为 MDI 格式的虚拟打印文件。

编辑提示:如果你在“名称”设置的下拉列表中没有找到 “MicrosoftOffice DocumentImageWriter”项,那证明你在安装 Office 2003 的时候没有安装该组件,请使用 Office 2003 安装光盘中的“添加/删除组件”更新安装该组件。

第二步:运行 MicrosoftOfficeDocument Imaging,并利用它来打开刚才保存的 MDI 文件,选择“工具→ 将 文本发送到 Word”菜单,并在弹出的窗口中勾选“在输出时保 持图片版式不变” ,确 认后系统提示“必须在执行此操作前重新运行 OCR。

这可能需要 一些时间” ,不管它,确认即可。

编辑提示:目前,包括此工具在内的所有软件对 PDF 转 DOC 的识 别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家 在转换后还需要手工对其进行后期排版和校对工作。

2、实现工具:SolidConverterPDF 应用情景:利用 Office2003 中的 MicrosoftOffice DocumentImaging 组件来实现 PDF 转 Word 文档在一定程度上的 确可以实现 PDF 文档到 Word 文档的转换,但是对于很多“不规则”2

的 PDF 文档来说,利用上面的方法转换出来的 Word 文档中常常是乱 码一片。

为了恢复 PDF 的原貌,推荐的这种软件可以很好地实现版式 的完全保留,无需调整,而且可以调整成需要的样板形式。

使用方法: 1、下载安装文件 SolidConverterPDF,点击安装。

编辑提示:安装前有个下载安装插件的过程,因此需要保证网络 连接通畅。

2、运行软件,按工具栏要求选择需要转换的 PDF 文档,点击右 下的“转 换” (Convert) 按扭, 选择自己需要的版式, 根据提示完成转换。

一,PDF 转换 WORD 篇 如何提取 PDF 中的文字,图片等特效 我们日常工作学习中有关的学术论文或学术报告或者课程教材 等等都以 pdf 格式保存,如何把它们转换成可编辑的 word 文档或者 提取相应的重要信息。

网上有不少 pdf 到 word 的转换软件或插件, 可是大都对英文等识别姣好,一些繁体的软件又不适合我们,我们可 以利用 office2003 的组件 microsoftofficeDocumentImaging 可以实 现从 PDF 中任意提取任何页面的文字和图像等功能。

先来介绍一下最 简单的提取方法吧,打开 PDF 的文件资料,利用本身的文本提取工具 可以完全提取了,但是有的 PDF 是增加了 128 位秘钥的,想要提取是 不会那么简单的,即使用软件或者简单复制的时候,出来的效果却是 乱码之类的东西。

3

而且单纯的用文本工具只能把 PDF 中的文字提取出来, 其他的特 效:图片等是无法显示出来的,首先看一例文本提取:如果想提取下 图的文字:具有 SAP 的企业系统。

直接在 ADOBEREADER 的“工具”选项那就轻松可以实现: 或者直接利用快捷方式中的图形直接提取就可以了: 直接提取的效果就是我们通常所说的“复制”到“粘贴” ,文字 东西少还是可以,如果有 300 页的 PDF 我怕只有“傻瓜”才会那么做 吧!呵呵!玩笑!下面的图片我们怎么办(举个例子)如果是报表的 数据图呢?如何人、 放到 WORD 里呢?所以只有求助 office2003 的组 件 microsoftoffice DocumentImaging 的功能了, 即使它不是最好的, 在 ADOBEREADER 那有一个“打印机”的图标,进入后来到如下的画面,在名称那选择 “microsoftofficeDocumentImaging” ,下面还有设置的打印范围, 可以选择所有的 PD F 文件或者选择想要提取的页面也可以,或者指定多少页到多少 页都是可以实现的, 页面处理功能就是保持页面的大小或者根据你要 打印的纸张的大小选择就可以了,页数就是处理后的页数。

根据需要最后进行了选择,什么都保持原来的大小和清晰度等, 然后我们确认就可以了: 之后会出现“保存”的对话框,注意下面的文件名,可以更改或 者改变的,但是下面的保存 类型千万不要变,保持 MDI 格式就可以了:4

之后会出现所预览的页面,也就是你上面选择参数后的结果,这 时候的图片和 PDF 还是一样的: 之后在[color[red] “工具” 这个选项上选择 “将文本发送到 WROD” 这个选项: 然后出现一个可选择的对话框,选择的时候要注意选择“输出时 候保持文件不变” ,然后保存到想要的位置: 如果机器之前设置了 OCR 擦件选项, 需要更新的, 不过不要紧的, 系统会自动给你安装的,选择确定就可以,时间也不会很久的,一般 的机器 3 秒 OK 了: 然后安装开始: 之后就是安装的进度条了,很快安装 OVER,功能可以用了: 最后呈现在你面前的就是转换后的文字了,其实应该是黑色字 体,5 号字的大小的,我从新给调整了和以前的模式,是不是一样的 呢? 图片的实现和文字的实现是一样的,不过 WORD 一定要支持图片 模版的,2003 版本的可以,2000 没尝试,经过很多的使用,可以说 95%的文字都是可以清晰的提取出来的,这点没问题的!呵呵! 二,WORD 转换 PDF 篇 利用 5DPDFCREATER 转换 PDF WORD 转换到 PDF 可以实现的软件简直太多了,但是本人在学习 应用的时候觉得还是 5 D-PDF 最好不过了,毕竟支持微软的产品实在是太少了,相对这5

款软件才真正实现了 WORD PPTEXCELFRONTPAGE 等众多 OFFICE 软件的转换,而且效果和速 度都是一流的。

首先还是用 WORD 或者 PPT 等打开我们需要转换的文件,这里以 WORD 为例子,就是 我编写的这个帖子吧: 然后在“文件”选项那选择“打印”的选项: 之后来到打印的属性窗口中, 在这里可以有很多属性可以供我们 选择,可谓是功能强大啊,在名称中选择“5DPDFCREATER” ,打印内 容中可以选择本版面的文字和所有版面的文字等, 而且还可以设置页 数和大小,想变成什么样的 PDF 都可以,而且在打印机属性中还可以 设置变成 PDF 后的颜色,使它更加个性化: 另外在“打印”属性中可以有如下选择,调节 A4 的纸张大小和 形状,打印成 PDF 的文字。

XML 信息等等,而且选择隐藏和背景色, 最后确定: 最后会弹出对话框,我们可以更改文件名,保存的类型也很多, 大家可以自己尝试的,我们在这变换的是 PDF 形式,下面的就是 5DPDFCREATER 最强大的地方了,我们选的是“PRESSREADY”这里可 以自己研究着,里面有好多想不到的东西呢!呵呵!最后确定: 最后我们看看转换的效果吧, 由于没有加任何的特效所以很一样 的,大家可以根据自己的 爱好著名自己的信息等等,防止别人更改等,很多人性的东西:6

3.ScanSoftPDFConverterForMicrosoftWord 我们平时下载的资料中,有许多都是以 PDF 格式发布的,但有时 需要将 PDF 文档中的信息转换到 Word 中进行编辑,使用复制粘贴的 方法虽然可以将文字、图片等信息转移到 Word 中,但是原 PDF 文档 中的格式、字体等信息就会丢失,编辑起来很不方便,我们可以使用 ScanSoft 公司发布的 “PDFConverter” 插件来完成从 PDF 文档向 Word 文档的转换工作。

下载并安装“PDFConverter”后,将 Word 文档的“打开”对话 框的“文件类型”改为“所有文件” ,使用 Word 加载 PDF 文档,插件 会自动启动并进行转换,转换后的格式、图片位置等信息基本上可以 保持原有 PDF 文档的风格。

说明: 文中介绍的插件和模板都是基于 Word2003 的。

大部分第三方插 件都是基于 Word 中的宏来嵌入和运行。

Word2003 出于对文档安全性 的考虑,将宏的安全性默认 为“高” ,使得一些第三方插件无法运行。

您在使用本文介绍的 插件时,可以将 Word2003 中的“宏安全性”设置为“中” 。

具体设置方法为:打开一个 Word 文档,将【工具】|【宏】|【安 全性】下的“安全级”设置为“中” 。

在运行下面介绍的插件时,Word 会弹出“安全警告”对话框,如果确认是自己所安装的插件,就可以 单击“启用宏”来运行此插件。

4.举办国际会议, 有时候会遇到外国参加者无法阅读我们制作的7

pdf 文件那是因为我们用中文系统,转化之后,对方无法辨识中文字 符集。

这时候可以用嵌入字体和调整颜色设置来解决,当然,相应的, 文件也会变得比较大。

具体操作如下: 1,安装 acrobat 完整版(不是 AcrobatReader,是 Ac robat) 。

2,打开 word(ppt)文档。

3,单击菜单中“文件” ,选择“打印” 。

4,在打印机中选择 AcrobatDistiller,单击右侧的“属性” 。

5,点到“AdobePDF 设置” ,选择“编辑转换设置” 。

6, 点到 “字体” , 把 “嵌入所有字体” 打上勾 (这一步很关键啊! ) 。

7,点到“颜色” ,把”设置文件“从“无”改为“欧洲印前默认 设置” (关键!关键! ) 。

8,点击右侧的“确定”或者“另存为” ,都会跳出对话框,让你 保存当前设置。

(选个好 记的名字吧,比如 gUT) 9,存好后,再次点击“确定”退回到“AdobePDF 设置” ,这时 候的转换设置已经变成新设置了,如“gUT” 。

10,点击“确定” ,再点击“确定”打印,就产出一个能够在非 中文系统中辨认的 pdf 文件了。

11,记得下次重新开启 office 并进行 Distiller 打印的时候,8

要重新选择一下转换设置,在设置中选中“gUT”就可以了。

5.将带有链接的 DOC 文件转成 PDF 如果将 100 多个带有大量链接 的 DOC 文件转换 PDF 文件,应该怎么做? 利 用 AdobeAcrobat6.0 的 “ 从 网 页 创 建 PDF ” (快捷键为 “Shift+Ctrl+O” )转换功能就可以轻松实现上述要求。

1 . 将 需 要 转 换 的 DOC 文 件 放 置 于 同 一 个 文 件 夹 中 , 打 开 Word2003,依次打开“文件→新建→新建文档→模板→本机上的模板 →其他文档→转换向导” ,启用“转换向导” 。

2.单击“下一步”按钮选择转换方式,这里选择将 DOC 文件转 换为 HTML 文件,继续选择“源文件夹”和“目标文件夹” ,最后确定 需要转换的文件,点击“完成” 。

至此,就完成了文件格式的转换。

接下来你应该知道怎么做了吧。

只有打开 Acrobat 将一个个 HTML 文件转换为 PDF 文件,就可以轻松完成这个看似繁重的任务。

6.免费的 PDF 打印机,我试过用它把 doc 文件转成 pdf 文件,非 常好用! ! 介绍: http://www.cutepdf.com/Products/CutePDF/writer.asp 下载地址: FreeDownload(1.6MB)(VistaReady) http://www.cutepdf.com/download/CuteWrit er.exe 开发者:http://www.cutepdf.com/需要 PS2PDFconverter 的支9