Python用imghdr模块识别图片格式实例解析

yipeiwu_com5年前Python基础

imghdr模块

功能描述:imghdr模块用于识别图片的格式。它通过检测文件的前几个字节,从而判断图片的格式。

唯一一个API

imghdr.what(file, h=None)

第一个参数file可以是用rb模式打开的file对象或者表示路径的字符串和PathLike对象。h参数是一段字节串。函数返回表示图片格式的字符串。

>>> import imghdr
>>> imghdr.what('test.jpg')
'jpeg'

具体的返回值和描述如下:

返回值 描述 检测方式
jpeg 用JFIF或者Exif格式保存的JPEG图片 第7到第10个字节是b'JFIF'或者b'Exif'
png 可移植网络图形格式(Portable Network Graphic Format) 以字节串b'\x89PNG\r\n\x1a\n'开头
gif GIF(Graphics Interchange Format)的87版本和89版本 前6个字节为b'GIF87a'或者b'GIF89a'
tiff TIFF(Tag Image File Format)的两种字节顺序 前两个字节为b'MM'或者b'II'
rgb SGI ImgLib 以字节串b'\x01\xda'开头
pbm Portable Bitmap 第1个字节为b'P',第2个字节为b'1'或b'4',第3个字节为b'\t'或b'\n'或b'\r'
pgm Portable Graymap Files 第1个字节为b'P',第2个字节为b'2'或b'5',第3个字节为b'\t'或b'\n'或b'\r'
ppm Portable Pixmap Files 第1个字节为b'P',第2个字节为b'3'或b'6',第3个字节为b'\t'或b'\n'或b'\r'
rast Sun Raster 以字节串b'\x59\xA6\x6A\x95'开头
xbm X Bitmap Files 以字节串b'#define ‘开头
bmp Bitmap,Windows标准图像文件格式 以字节串b'BM'开头
webp 谷歌的WebP格式,Python3.5加入 以字节串b'RIFF'开头并且第9到第12个字节为b'WEBP'
exr OpenEXR,Python3.5加入 以字节串b'\x76\x2f\x31\x01'开头

模块内部缺陷

当h参数不为空时,模块会忽略掉file参数,直接检测h参数,但此时file参数又是必须提供的,算是一个设计缺陷吧。博主个人感觉这个h参数根本没有存在的意义,没必要放在参数列表里面。

>>> import imghdr
>>> imghdr.what('test.jpg', b'\x89PNG\r\n\x1a\n')
'png'
>>>

自定义检测流程

imghdr内部使用了test_jpeg、test_png、test_gif等函数检测文件的格式。模块内部维护了一个函数列表imghdr.tests,每次调用what函数的时候,会按列表里的顺序调用检测函数,当检测函数返回结果时退出循环。用户可以通过修改这个列表达到修改检测流程的目的。同时,也可以自行添加检测函数到列表里面。

下面这个例子,博主添加了一个函数放在检测流程的最后提示文件不是图片:

>>> import imghdr
>>> def final(h, f):
... print("This file isn\'t a image!")
...
>>> imghdr.tests.append(final)
>>> imghdr.what("imghdr.md")
This file isn't a image!

自行添加检测函数需要接收两个参数h和f,h是用来检测的字节串,f是file对象。但是在模块内部自带的检测函数都是没用到这个f参数的…

命令行启动imghdr模块

博主读源码的时候发现了官方文档里面没提到的两个函数,提供了直接用命令行启动imghdr模块的方法。

只需要调用python -m imghdr [-r] file1 file2...就可以直接检测文件的类型。file可以是文件也可以是文件夹。该命令默认只检测文件夹下一层的文件类型,如果需要递归检测,则加上-r参数。

每个文件以”文件名: 文件类型/None”的形式打印一行输出结果。

总结:可能是因为使用的人少的原因,imghdr这个模块内部有挺多小问题,不过只要老老实实按照官方提供的文档使用是不会出事的。博主后面试着改一下这个模块然后pr上去。

以上就是本文关于Python用imghdr模块识别图片格式实例解析的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

相关文章

python向图片里添加文字

python向图片里添加文字

本文实例为大家分享了python图片添加文字的具体代码,供大家参考,具体内容如下 #!/usr/bin/python #-*-coding:utf-8-*- from PIL im...

Django分页功能的实现代码详解

Django分页功能的实现代码详解

Django分页功能的实现 打开命令行窗口,创建Django工程,使用以下命令: django-admin startproject djpage cd djpage python ma...

django输出html内容的实例

最近在学习django,于是就用django做了一个简单的网站,用来练手,具体功能就是从网上抓取数据,然后放到我的网站上面,但是遇到一个问题就是django无法输出html格式的内容,只...

Python中numpy模块常见用法demo实例小结

本文实例总结了Python中numpy模块常见用法。分享给大家供大家参考,具体如下: import numpy as np arr = np.array([[1,2,3],...

python遍历文件夹,指定遍历深度与忽略目录的方法

背景 需要在文件夹中搜索某一文件,找到后返回此文件所在目录。用最常规的os.listdir()方式实现了一版,但执行时报错:递归超过最大深度。于是自己添加了点功能,之所有写此函数是为了让...