Python 2.7中文显示与处理方法

yipeiwu_com6年前Python基础

在学习使用Python的过程中,一定会遇到文字输入与处理,这就不可避免的会使用中文字符。但是Python2.7默认使用的字符集是ASCII,并不支持中文字符的显示与处理,因些如果要在Python中处理中文就需要进行一些额外的处理。

一、在开头处声明Python使用UTF-8编码显示字符

#/usr/bin/env python
# -*- coding: UTF-8 -*-

但这样做,只是让你的程序在运行的过程中显示中文,如果你要将中文字符存储在文件中,或者写入到数据库中,这样的设置是不能满足你的需要。

二、设置系统默认字符编码

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

也许是Python的bug在import sys后必须再一次reload(sys),下面去设置默认字符编码的语句才能生效。

三、遇到需要处理中文的地方,就随时进行UTF-8编码

经常会遇到的是,进行了第一步和第二步设置后,还是无法正常显示和处理中文字符,这时也只能随用随编码了。

假设待处理字符串为string

使用下面的语句进行utf-8编码:

string.encode('utf-8')

使用下面的语句进行utf-8解码:

unicode(string, encoding='utf-8')

如果为了方便可以将上面二个语句写成方法随时调用:

def encode_utf8(string):
 return string.encode('utf-8')

def decode_utf8(string)
 return unicode(string, encoding='utf-8')

以上这篇Python 2.7中文显示与处理方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python字符串连接的N种方式总结

python中有很多字符串连接方式,今天在写代码,顺便总结一下: 最原始的字符串连接方式:str1 + str2 python 新字符串连接语法:str1, str2 奇怪的字符串方式:...

Tensorflow实现在训练好的模型上进行测试

Tensorflow可以使用训练好的模型对新的数据进行测试,有两种方法:第一种方法是调用模型和训练在同一个py文件中,中情况比较简单;第二种是训练过程和调用模型过程分别在两个py文件中。...

python 删除指定时间间隔之前的文件实例

遍历指定文件夹下的文件,根据文件后缀名,获取指定类型的文件列表;根据文件列表里的文件路径,逐个获取文件属性里的“修改时间”,如果“修改时间”与“系统当前时间”差值大于某个值,则删除该文件...

python正常时间和unix时间戳相互转换的方法

本文实例讲述了python正常时间和unix时间戳相互转换的方法。分享给大家供大家参考。具体分析如下: 这段代码可以用来转换常规时间格式为unix时间戳,也可以将unix时间戳转换回来,...

Python实现word2Vec model过程解析

Python实现word2Vec model过程解析

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 import...