Python实现截取PDF文件中的几页代码实例

yipeiwu_com6年前Python基础

截取PDF文件中的几页有很多做法。

1. 把文件用Google的Chrome浏览器打开,打印其中几页,另存为PDF。简单。

2. 安装Adobe的Acrobat,里面会有更全的功能。然而,收费。

3. 用Python的PyPDF2包。(Python 3,亲测有效)

下面是Python代码实例:

pip install PyPDF2
from PyPDF2 import PdfFileWriter, PdfFileReader
# 开始页
start_page = 0
# 截止页
end_page = 5
output = PdfFileWriter()
pdf_file = PdfFileReader(open("input.pdf", "rb"))
pdf_pages_len = pdf_file.getNumPages()
# 保存input.pdf中的1-5页到output.pdf
for i in range(start_page, end_page):
  output.addPage(pdf_file.getPage(i))
outputStream = open("output.pdf", "wb")
output.write(outputStream)

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对【听图阁-专注于Python设计】的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

python中scikit-learn机器代码实例

我们给大家带来了关于学习python中scikit-learn机器代码的相关具体实例,以下就是全部代码内容: # -*- coding: utf-8 -*- import num...

Pandas时间序列重采样(resample)方法中closed、label的作用详解

Pandas提供了便捷的方式对时间序列进行重采样,根据时间粒度的变大或者变小分为降采样和升采样: 降采样:时间粒度变大。例如,原来是按天统计的数据,现在变成按周统计。降采样会涉及到...

解密Python中的描述符(descriptor)

Python中包含了许多内建的语言特性,它们使得代码简洁且易于理解。这些特性包括列表/集合/字典推导式,属性(property)、以及装饰器(decorator)。对于大部分特性来说,这...

numpy中的ndarray方法和属性详解

NumPy数组的维数称为秩(rank),一维数组的秩为1,二维数组的秩为2,以此类推。在NumPy中,每一个线性的数组称为是一个轴(axes),秩其实是描述轴的数量。比如说,二维数组相当...

详解Django-auth-ldap 配置方法

使用场景 公司内部使用Django作为后端服务框架的Web服务,当需要使用公司内部搭建的Ldap 或者 Windows 的AD服务器作为Web登录认证系统时,就需要这个Django-au...