通过Python模块filecmp 对文件比较的实现方法

yipeiwu_com5年前Python基础

filecmp定义了两个函数,用于方便地比较文件与文件夹:

    filecmp.cmp(f1, f2[, shallow]):

 比较两个文件的内容是否匹配。参数f1, f2指定要比较的文件的路径。可选参数shallow指定比较文件时是否需要考虑文件本身的属性(通过   os.stat函数可以获得文件属性)。如果文件内容匹配,函数返回True,否则返回False,

import filecmp 
s = filecmp.cmp("qin.txt", "jian.txt") 
print(s) 

运行结果如下:

如果俩文件相同则返回True , 如果不同则返回False

    filecmp.cmpfiles(dir1, dir2, common[, shallow]):

 比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

import filecmp 
match,mismatch,errors = filecmp.cmpfiles("qin", "fu",['a.txt','b.txt']) 
print("%s\n%s\n%s"%(match,mismatch,errors)) 

运行结果如下:

['a.txt'] -- 表示两个文件都有该文件,并且完全匹配
['b.txt'] -- 表示两个文件都有该文件,但是不匹配
[]          -- 表示没有错误的文件

    filecmp模块中定义了一个dircmp类,用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

    dircmp提供了三个方法用于报告比较的结果:

report():只比较指定文件夹中的内容(文件与文件夹)report_partial_closure():比较文件夹及第一级子文件夹的内容report_full_closure():递归比较所有的文件夹的内容

例子:在文件夹"qin"中含有文件"a.txt", 在文件夹"fu"中含有文件"a.txt"和"b.txt",其两个文件夹下面的文件"a.txt"内容一样,

<span style="font-size: 12px;">import filecmp 
x = filecmp.dircmp("qin","fu") 
diff = x.report() 
print(diff)</span> 

输出结果如下:

diff qin fu  
Only in fu: ["b.txt"] 
Identical files: ["qin.txt"] 

如果两个文件夹下面的文件"a.txt"内容不相同那么结果如下:

输出结果如下:

diff qin fu 
Only in fu: ["b.txt"] 
Differing files: ["a.txt"] 

dircmp还提供了下面这些属性用于获取比较的详细结果:

•left_list:左边文件夹中的文件与文件夹列表;
•right_list:右边文件夹中的文件与文件夹列表;
•common:两边文件夹中都存在的文件或文件夹;
•left_only:只在左边文件夹中存在的文件或文件夹;
•right_only:只在右边文件夹中存在的文件或文件夹;
•common_dirs:两边文件夹都存在的子文件夹;
•common_files:两边文件夹都存在的子文件;
•common_funny:两边文件夹都存在的子文件夹;
•same_files:匹配的文件;
•diff_files:不匹配的文件;
•funny_files:两边文件夹中都存在,但无法比较的文件;
•subdirs:我没看明白这个属性的意思,python手册中的解释如下:A dictionary mapping names in common_dirs to dircmp objects

总结

以上所述是小编给大家介绍的通过Python模块filecmp 对文件比较的实现方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!

相关文章

python字典一键多值实例代码分享

python中字典可以一键多值,也就是意味着一个键可以对应多个值。 例: #encoding=utf-8 print '中国' #字典的一键多值 print'...

Pandas过滤dataframe中包含特定字符串的数据方法

Pandas过滤dataframe中包含特定字符串的数据方法

假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢? 因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。 举例说明: 我希望提取所有...

浅谈Python对内存的使用(深浅拷贝)

本文主要研究的是Python对内存的使用(深浅拷贝)的相关问题,具体介绍如下。 浅拷贝就是对引用的拷贝(只拷贝父对象) 深拷贝就是对对象的资源的拷贝 >>> a...

python3连接MySQL数据库实例详解

本文实例为大家分享了python3连接MySQL数据库的具体代码,供大家参考,具体内容如下 #python3连接MySQL实例 import pymysql """导入连接MySQ...

深入理解python对json的操作总结

深入理解python对json的操作总结

Json简介:Json,全名 JavaScript Object Notation,是一种轻量级的数据交换格式。Json最广泛的应用是作为AJAX中web服务器和客户端的通讯的数据格式。...