Python实现截取PDF文件中的几页代码实例

yipeiwu_com6年前Python基础

截取PDF文件中的几页有很多做法。

1. 把文件用Google的Chrome浏览器打开,打印其中几页,另存为PDF。简单。

2. 安装Adobe的Acrobat,里面会有更全的功能。然而,收费。

3. 用Python的PyPDF2包。(Python 3,亲测有效)

下面是Python代码实例:

pip install PyPDF2
from PyPDF2 import PdfFileWriter, PdfFileReader
# 开始页
start_page = 0
# 截止页
end_page = 5
output = PdfFileWriter()
pdf_file = PdfFileReader(open("input.pdf", "rb"))
pdf_pages_len = pdf_file.getNumPages()
# 保存input.pdf中的1-5页到output.pdf
for i in range(start_page, end_page):
  output.addPage(pdf_file.getPage(i))
outputStream = open("output.pdf", "wb")
output.write(outputStream)

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对【听图阁-专注于Python设计】的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

对Django项目中的ORM映射与模糊查询的使用详解

ORM映射 什么是ORM映射?在笔者认为就是对SQL语句的封装,所写语句与SQL对应语句含义相同,使开发更加简单方便,不过也是存在弊端的,使程序运行效率下降。例如: UserInf...

Pycharm 2019 破解激活方法图文详解

Pycharm 2019 破解激活方法图文详解

使用破解补丁方法虽然麻烦,但是可用激活到2099年,基本上是永久激活了,毕竟在座各位能活到这个年份也是寥寥无几了吧!! 步骤一、下载破解补丁, 链接: https://pan.baid...

Django 静态文件配置过程详解

静态文件配置 概述: 静态文件交由Web服务器处理,Django本身不处理静态文件。简单的处理逻辑如下(以nginx为例): URI请求 --> 按照Web服务器里面的配置规...

解析Mac OS下部署Pyhton的Django框架项目的过程

一、安装软件包并创建项目 $sudo pip install django $sudo python -c "import django;print django.VERSION"...

Python构建图像分类识别器的方法

机器学习用在图像识别是非常有趣的话题。 我们可以利用OpenCV强大的功能结合机器学习算法实现图像识别系统。 首先,输入若干图像,加入分类标记。利用向量量化方法将特征点进行聚类,并得出中...