Python中的 is 和 == 以及字符串驻留机制详解

yipeiwu_com5年前Python基础

is 和 ==

先了解下官方文档中关于 is 和 == 的概念。is 表示的是对象标示符(object identity),而 == 表示的是相等(equality);is 的作用是用来检查对象的标示符是否一致,也就是比较两个对象在内存中的地址是否一样(相当于检查 id(a) == id(b)),而 == 是用来检查两个对象引用的值是否相等(相当于检查 a.eq(b));这点和Java有点类似,只不过Java中是用 == 来比较两个对象在内存中的地址,用 equals() 来检查两者之间的值是否相等。

is ==
概念 对象标示符 相等
作用 比较对象在内存中的地址 检查两个对象引用的值
示例 id(a) == id(b) a.eq(b)

字符串驻留机制

Python中的字符串采用了intern机制,当需要值相同的字符串的时候(比如标识符),可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接和修改字符串是会比较影响性能的。

因为是不可变的,所以字符串的操作都不是replace,而是新建对象,这也是为什么拼接多字符串的时候不建议用+而用join(),join()是先计算出所有字符串的长度,然后再拷贝,只new一次对象。

需要注意的是,并不是所有的字符串都会采用intern机制,当且仅当只包含下划线、数字、字母的字符串才会被intern。

相关示例

示例一

a = "hello"
b = "hello"
print(a is b) # 输出 True 
print(a == b) # 输出 True

值相同的简单字符串对象在字符串池里只会保存一份,这决定了字符串必须是不可变对象,所以a和b是同一个对象

示例二

a = "hello world"
b = "hello world"
print(a is b) # 输出 False
print(a == b) # 输出 True 

a和b中都有空格,所以不会被intern(空格不是python标识符),故a和b不是同一个对象。注意,这仅仅是在交互式命令行中执行,而在PyCharm或者保存为文件执行,结果是不一样的,主要是因为解释器做了一部分优化

示例三

a = 'ab' + 'c' is 'abc'
print(a) # 输出 True
ab = 'ab'
b = ab + 'c' is 'abc'
print(b) # 输出 False

第一个'ab'+'c'是在compile-time(编译期)求值的,被替换成了'abc',所以输出为True;第二个示例,ab+'c'是在run-time(运行期)拼接的,导致没有被自动intern

示例四

a = [1, 2, 3]
b = [1, 2, 3]
print(a is b) # 输出 False
print(a == b) # 输出 True 

a和b是列表,不是同一个对象

示例五

a = [1, 2, 3]
b = a
print(a is b) # 输出 True 
print(a == b) # 输出 True

把a的引用复制给b(引用赋值),在内存中其实是指向同一个对象

示例六

a = ["I", "love", "Python"]
b = a[:]
print(a is b) # 输出 False
print(a == b) # 输出 True
print(a[0] is b[0]) # 输出 True
print(a[0] == b[0]) # 输出 True

b通过切片操作重新分配了对象(切片赋值),但值和a相同。由于切片拷贝是浅拷贝,这说明列表中的元素并未重新创建,因此a[0] is b[0]输出为True

示例七

a = 1
b = 1
print(a is b) # 输出 True
print(a == b) # 输出 True

Python会对比较小的整数对象进行缓存,下次用的时候直接从缓存中获取

示例八

a = 320
b = 320
print(a is b) # 输出 False
print(a == b) # 输出 True

Python仅仅对比较小的整数对象进行缓存(范围为范围[-5, 256]),而并非是所有整数对象。注意,这仅仅是在交互式命令行中执行,而在PyCharm或者保存为文件执行,结果是不一样的,主要是因为解释器做了一部分优化

is 与 == 对比

is 与 == 相比计算速度会更快,因为它不能重载,不用进行特殊的函数调用,通过直接比较两个整数 id,减少了函数调用的开销。而 a == b 则是等同于a.eq(b),继承自 object 的 eq 方法原本也是比较两个对象的id,结果与 is 一样,但大多数Python对象会覆盖重写object的 eq 方法,而定义内容的相关比较,所以比较的是对象属性的值。

在变量和单例值之间比较时,应该使用 is。目前,最常使用 is 的地方是当判断对象是不是 None,下面是推荐的写法: xxx is None;判断不是None的推荐写法是: xxx is not None

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

跟老齐学Python之dict()的操作方法

dict的很多方法跟list有类似的地方,下面一一道来,并且会跟list做一个对比 嵌套 嵌套在list中也存在,就是元素是list,在dict中,也有类似的样式: >>...

python实现rsa加密实例详解

python实现rsa加密实例详解 一 代码 import rsa key = rsa.newkeys(3000)#生成随机秘钥 privateKey = key[1]#私钥 pu...

Python自然语言处理之词干,词形与最大匹配算法代码详解

本文主要对词干提取及词形还原以及最大匹配算法进行了介绍和代码示例,Python实现,下面我们一起看看具体内容。 自然语言处理中一个很重要的操作就是所谓的stemming和lemmatiz...

numpy的文件存储.npy .npz 文件详解

Numpy能够读写磁盘上的文本数据或二进制数据。 将数组以二进制格式保存到磁盘 np.load和np.save是读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式...

pandas DataFrame 删除重复的行的实现方法

pandas DataFrame 删除重复的行的实现方法

1. 建立一个DataFrame C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,1...