python2 中 unicode 和 str 之间的转换及与python3 str 的区别

yipeiwu_com5年前Python基础

在python2中字符串分为 unicode 和 str 类型

  Str To Unicode 使用decode(), 解码
  Unicode To Str 使用encode(), 编码

返回数据给前端时需要先将unicode转换为str类型, 事实上, python2 中的 str 就是一串字节(byte), 而网络通信时, 传输的就是字节. 如果前端需要接收json数据, 需要使用 json.dumps() 将数据转换为json格式进行返回, 当数据是嵌套类型的数据, 内层的数据可能无法直接转换为str类型的数据, 这时可以使用eval()函数进行转换, 再使用json.dumps()进行转换为json格式的数据, json 事实上就是一串字符串.

python2 默认情况下 字符串 的类型是 str 类型, 如果需要得到 unicode 类型的字符串, 需要使用下面的方式进行声明:

my_str = u"lowmanisbusy" # 在变量前面加上 u

在 python2 中如果没有重新指定字符编码, 定义中文的字符串时, 需要加上 "u", 指明该字符串为 unicode 类型, 指定使用unicode编码对其进行编码保存:

my_zh_str = u"渣男不但丑" # 在变量前面加上 u

unicode编码: unicode编码为世界上所有字符都分配了一个唯一编号, 为十六进制, 如中文简体汉字 “渣” 的 Unicode编号就是 6E23, 在 python2就是 "\u6e23", 但是unicode仅仅定义了每个字符的编号,并没有定义如何将这个编号进行存储的方式,所以后来出现了utf-8, gbk等编码格式, 它们都是 unicode 的一种实现方式, 仍然使用了unicode 中的唯一编号, 个人对其的简单理解就是在unicode编码的基础之上又定义了对字符的存储方式.

在python3中字符串分为 str 和 bytes 两种类型

  Str To Bytes 使用 encode(), 编码
  Bytes To Str 使用 decode(), 解码

这里需要说明的是, python3 中 bytes 类型的字符串, 就相当于 python2 中 str 类型的字符串, python3中没有unicode类型的字符串, 这里其实涉及到默认编码的问题, python3默认字符编码为:utf-8, python2默认字符编码为:ASCII, ASCII码 包含了128个字符, 其中包括所有的英文字符, 阿拉伯数字, 标点符号, 控制符号等, 却没有中文, 中文是象形文字, 需要使用到更多的字节进行组合来表示出每个汉字, 因此ASCII是无法满足对中文的表示的, 所以 python2中如果没有重新设置字符编码的话,代码中就不允许出现str类型的中文字符串(可以指定为unicode类型), 因为Cpython2解释器无法识别. 至于 ASCII, UNICODE, UTF-8 之间的关系与区别这里就不细说了, 可以自行去了解一下( utf-8编码  是  unicode编码 的一种实现方式, 个人理解可以认为是下面这样一种关系: utf-8 <---> unicode <--->byte, 最终,数据的传输仍然是以二进制的形式一个一个字节进行传输的)

默认情况下,python3中字符串的类型为 str, 在web框架中, 会自动将 str转换成 byte 向前端返回.

当需要将某种编码格式的bytes转换另外一种编码格式的bytes时需要先按原来的编码格式进行解码成str类型, 再使用新的编码格式转换为bytes类型

如: 若存在变量 my_bt, 其为编码格式 gbk 的 bytes, 需将其转换为utf-8的编码格式,需要进行如下的处理:

my_str = my_bt.decode("gbk") # 解码
  my_bt = my_str.encode("utf-8") # 重新编码

 因为 python3 中没有 unicode 类型的字符串, 所有在 python3 中使用下面这种方式定义字符串是没有意义的

my_str = u"渣男不但丑"

ps:下面看下Python2之unicode转字符串

str.encode('unicode-escape').decode('string_escape')

总结

以上所述是小编给大家介绍的python2 中 unicode 和 str 之间的转换及与python3 str 的区别,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

Python之eval()函数危险性浅析

一般来说Python的eval()函数可以把字符串“123”变成数字类型的123,但是PP3E上说它很危险,还可以执行其他命令! 对此进行一些试验。果然,如果python写的cgi程序中...

python对url格式解析的方法

本文实例讲述了python对url格式解析的方法。分享给大家供大家参考。具体分析如下: python针对url格式的解析,可根据指定的完整URL解析出url地址的各个部分 from...

啥是佩奇?使用Python自动绘画小猪佩奇的代码实例

啥是佩奇?使用Python自动绘画小猪佩奇的代码实例

最近社会猪可是火遍了大江南北,不蹭下热度可对不起它。见过手画的佩奇,见过用代码画的吗? 没有?那就来看我大显身手。 用python的turtle库来画小猪佩奇。 有人问:turtle难不...

详谈python3中用for循环删除列表中元素的坑

for循环语句的对象是可迭代对象,可迭代对象需要实现__iter__或iter方法,并返回一个迭代器,什么是迭代器呢?迭代器只需要实现 __next__或next方法。 现在来验证一下列...

Python实现发送与接收邮件的方法详解

Python实现发送与接收邮件的方法详解

本文实例讲述了Python实现发送与接收邮件的方法。分享给大家供大家参考,具体如下: 一、发送邮件 这里实现给网易邮箱发送邮件功能: import smtplib import tk...