量大零散但内容相关的 pdf 文档在处理时非常麻烦,且对这些文档的管理也较为复杂。合并这些 pdf 文档可以很好地解决这些问题。合并 pdf 文档不仅可以简化文档处理流程,还可以方便分享和阅览,从而显著提高工作效率。本文将展示如何使用 spire.pdf for python 在 python 程序中合并 pdf 文件。
安装 spire.pdf for python
本教程需要用到 spire.pdf for python 和 plum-dispatch v1.7.4。可以通过以下 pip 命令将它们轻松安装到 vs code 中。
pip install spire.pdf
如果您不确定如何安装,请参考本教程:如何在 vs code 中安装 spire.pdf for python
用 mergefiles() 方法合并 pdf 文档
spire.pdf for python 中的 pdfdocument.mergefiles() 方法可以直接将多个 pdf 文档合并为一个 pdf 文档。以下是详细操作步骤:
- 创建 pdf 文件路径列表。
- 使用 document.mergefiles(inputfiles: list[str]) 方法合并 pdf 文件。
- 使用 pdfdocumentbase.save(filename: str, fileformat.pdf) 方法保存合并后的文档。
- python
from spire.pdf.common import *
from spire.pdf import *
# 创建pdf文件路径列表
inputfile1 = "示例1.pdf"
inputfile2 = "示例2.pdf"
inputfile3 = "示例3.pdf"
files = [inputfile1, inputfile2, inputfile3]
# 合并pdf文档
pdf = pdfdocument.mergefiles(files)
# 保存结果文档
pdf.save("output/合并pdf.pdf", fileformat.pdf)
pdf.close()
通过复制页面合并 pdf 文档
使用 pdfdocument.appendpage(pdfdocument) 方法可以通过克隆页面的方式合并pdf文件。具体步骤如下:
- 创建 pdf 文件路径列表。
- 将每个 pdf 文档作为 pdfdocument 对象加载,并将它们添加到列表中。
- 创建一个 pdfdocument 对象以创建新的 pdf 文件。
- 遍历每个加载的 pdf 文档,并使用 pdfdocument.appendpage() 方法将它们的页面插入到新的 pdf 文档中。
- 使用 pdfdocument.savetofile() 方法保存新的 pdf 文档。
- python
from spire.pdf.common import *
from spire.pdf import *
# 创建pdf文件路径列表
file1 = "示例1.pdf"
file2 = "示例2.pdf"
file3 = "示例3.pdf"
files = [file1, file2, file3]
# 加载每个pdf文件并添加到列表中
pdfs = []
for file in files:
pdfs.append(pdfdocument(file))
# 创建一个pdfdocument对象
newpdf = pdfdocument()
# 将加载的pdf文档的页面插入到新的pdf文档中
for pdf in pdfs:
newpdf.appendpage(pdf)
# 保存新的pdf文档
newpdf.savetofile("output/复制页面合并pdf.pdf")
合并不同 pdf 文档的指定页面
spire.pdf for python 还支持使用 pdfdocument.insertpage() 方法和 pdfdocument.insertpagerange() 方法,从一个 pdf 文档中选择特定页面并插入到另一个 pdf 文档中,从而实现合并不容 pdf 文档的指定页面。具体步骤如下:
- 创建 pdf 文件路径列表。
- 将每个 pdf 文档作为 pdfdocument 对象加载,并将它们添加到列表中。
- 创建一个 pdfdocument 对象以创建新的 pdf 文件。
- 使用 pdfdocument.insertpage(pdfdocument, pageindex: int) 方法和 pdfdocument.insertpagerange(pdfdocument, startindex: int, endindex: int) 方法将加载的文档中选择的页面插入到新的 pdf 文档中。
- 使用 pdfdocument.savetofile() 方法保存新的 pdf 文档。
- python
from spire.pdf import *
from spire.pdf.common import *
# 创建pdf文件路径列表
file1 = "示例1.pdf"
file2 = "示例2.pdf"
file3 = "示例3.pdf"
files = [file1, file2, file3]
# 加载每个pdf文件并添加到列表中
pdfs = []
for file in files:
pdfs.append(pdfdocument(file))
# 创建一个pdfdocument对象
newpdf = pdfdocument()
# 将加载的pdf文档中选择的页面插入到新文档中
newpdf.insertpage(pdfs[0], 0)
newpdf.insertpage(pdfs[1], 1)
newpdf.insertpagerange(pdfs[2], 0, 1)
# 保存新的pdf文档
newpdf.savetofile("output/合并不同pdf的指定页面.pdf")
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。