pdf 文件格式能够保留原始文档的格式和布局,非常适合共享和打印。然而,通常情况下,pdf文件是不可编辑的,除非使用专门的软件或工具。通过将 pdf 文档转换为 word 格式,你可以轻松利用 word 的功能对文档进行进一步的编辑,例如修改、添加或删除文本,插入图片,添加批注和调整格式等。这篇文章将介绍如何使用 spire.pdf for python 在 python 中将 pdf 文档转换为 word doc 或 docx 格式。
安装 spire.pdf for python
本教程需要用到 spire.pdf for python 和 plum-dispatch v1.7.4。可以通过以下 pip 命令将它们轻松安装到 vs code 中。
pip install spire.pdf
如果您不清楚如何安装,请参考此教程: 如何在 vs code 中安装 spire.pdf for python
python 将 pdf 转换为 word doc 或 docx
spire.pdf for python 提供的 pdfdocument.savetofile(filename:str, fileformat:fileformat) 方法,可将 pdf 文档转换为 word doc 和 docx 格式。详细步骤如下:
- 创建 pdfdocument 类的对象。
- 使用 pdfdocument.loadfromfile() 方法加载 pdf 文档。
- 使用 pdfdocument.savetofile(filename:str, fileformat:fileformat) 方法将 pdf 文档转换为 word docx 或 doc 文件。
- python
from spire.pdf.common import *
from spire.pdf import *
# 创建pdfdocument类的对象
doc = pdfdocument()
# 加载pdf文档
doc.loadfromfile("示例.pdf")
# 将该pdf文档转换为word docx格式
doc.savetofile("pdf转docx.docx", fileformat.docx)
# 或将该pdf文档转换为word doc格式
doc.savetofile("pdf转doc.doc", fileformat.doc)
# 关闭pdfdocument对象
doc.close()
python 将 pdf 转换为 word 时设置文档属性
文档属性是与文档相关的属性或信息,用于提供文件的详细信息,例如文档的作者、标题、主题、版本、关键词、类别等等。通过这些属性,用户可以更全面地了解文档的内容和特征。
spire.pdf for python 提供的 pdftodocconverter 类,允许开发人员将 pdf 文档转换为 word docx 文件并为文件设置文档属性。具体步骤如下。
- 创建 pdftodocconverter 类的对象并将输入 pdf 文档的路径作为参数传入该类的构造函数中。
- 使用 pdftodocconverter 类的属性设置转换后的 word docx 文件的文档属性,例如标题、主题、作者和关键词等。
- 使用 pdftodocconverter.savetodocx()方法将 pdf 文档转换为 word docx 文件。
- python
from spire.pdf.common import *
from spire.pdf import *
#创建pdftodocconverter类的对象
converter = pdftodocconverter("示例.pdf")
# 为转换后的docx文件设置文档属性,如标题、主题、作者和关键词等
converter.docxoptions.title = "spire.pdf for python"
converter.docxoptions.subject = "该文档提供了spire.pdf for python产品的概述。"
converter.docxoptions.tags = "pdf, python"
converter.docxoptions.categories = " pdf处理库"
converter.docxoptions.commments = " spire.pdf是一个多平台的通用库,支持.net、java、python和c 等多种平台。"
converter.docxoptions.authors = "肖恩"
converter.docxoptions.lastsavedby = "亚楠"
converter.docxoptions.revision = 8
converter.docxoptions.version = "4.0"
converter.docxoptions.programname = "spire.pdf for python"
converter.docxoptions.company = "e-iceblue"
converter.docxoptions.manager = "e-iceblue"
# 将pdf文档转换为word docx文件
converter.savetodocx("转word并设置文档属性.docx")
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。