python 遍历字符串(含汉字)实例详解

yipeiwu_com6年前Python基础

python 遍历字符串(含汉字)实例详解

s = "中国china"
for j in s:
  print j

首先一个,你这个'a'是什么编码?可能不是你所想的gbk

>>> a='中国'
>>> a

这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。

另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。

接下来是遍历问题。

Linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:

>>> a[:3]

出来就是个”中”字

windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。

还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。

s = u"中国china"
for j in s:
  print j

输出如下:

中
国
c
h
i
n
a

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

相关文章

Python UnboundLocalError和NameError错误根源案例解析

如果代码风格相对而言不是那么的pythonic,或许很少碰到这类错误。当然并不是不鼓励使用一些python语言的技巧。如果遇到这这种类型的错误,说明我们对python中变量引用相关部分有...

python基础教程之缩进介绍

Python的运算符和其他语言类似 (我们暂时只了解这些运算符的基本用法,方便我们展开后面的内容,高级应用暂时不介绍) 数学运算 复制代码 代码如下: >>>print...

Python3中的列表生成式、生成器与迭代器实例详解

本文实例讲述了Python3中的列表生成式、生成器与迭代器。分享给大家供大家参考,具体如下: 列表生成式 Python内置的一种极其强大的生成列表 list 的表达式。返回结果必须是列表...

详解python多线程、锁、event事件机制的简单使用

线程和进程 1、线程共享创建它的进程的地址空间,进程有自己的地址空间 2、线程可以访问进程所有的数据,线程可以相互访问 3、线程之间的数据是独立的 4、子进程复制线程的数据 5、子进...

Django model序列化为json的方法示例

本文环境 Python 3.6.5 Django 2.0.4 fix(2018.5.19):最近得知Django 的model基类需要声明为abstract,故在原来的代码加...