Python实现截取PDF文件中的几页代码实例

yipeiwu_com6年前Python基础

截取PDF文件中的几页有很多做法。

1. 把文件用Google的Chrome浏览器打开,打印其中几页,另存为PDF。简单。

2. 安装Adobe的Acrobat,里面会有更全的功能。然而,收费。

3. 用Python的PyPDF2包。(Python 3,亲测有效)

下面是Python代码实例:

pip install PyPDF2
from PyPDF2 import PdfFileWriter, PdfFileReader
# 开始页
start_page = 0
# 截止页
end_page = 5
output = PdfFileWriter()
pdf_file = PdfFileReader(open("input.pdf", "rb"))
pdf_pages_len = pdf_file.getNumPages()
# 保存input.pdf中的1-5页到output.pdf
for i in range(start_page, end_page):
  output.addPage(pdf_file.getPage(i))
outputStream = open("output.pdf", "wb")
output.write(outputStream)

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对【听图阁-专注于Python设计】的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

python生成密码字典的方法

python生成密码字典的方法

这里我使用的是python27 主要用的是我之前博文里提到的itertools循环迭代的模块,用这个模块可以省不少事 首先要调用itertools import itertools...

python数据归一化及三种方法详解

python数据归一化及三种方法详解

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数...

python安装PIL模块时Unable to find vcvarsall.bat错误的解决方法

可能很多人遇到过这个错误,当使用setup.py安装python2.7图像处理模块PIL时,python默认会寻找电脑上以安装的vs2008.如果你没有安装vs2008,会出现Unabl...

Django中模型Model添加JSON类型字段的方法

本文实例讲述了Django中模型Model添加JSON类型字段的方法。分享给大家供大家参考。具体如下: Django里面让Model用于JSON字段,添加一个JSONField自动类型如...

python实现判断一个字符串是否是合法IP地址的示例

一个刚结束的笔试题目,简单贴一下吧,下面是具体实现: #!usr/bin/env python #encoding:utf-8 ''' __Author__:沂水寒城 功能:判断一个...