python 字符串只保留汉字的方法

yipeiwu_com6年前Python基础

如下所示:

def is_chinese(uchar):
 """判断一个unicode是否是汉字"""
 if uchar >= u'\u4e00' and uchar <= u'\u9fa5':
  return True
 else:
  return False

def is_number(uchar):
 """判断一个unicode是否是数字"""
 if uchar >= u'\u0030' and uchar <= u'\u0039':
  return True
 else:
  return False

def is_alphabet(uchar):
 """判断一个unicode是否是英文字母"""
 if (uchar >= u'\u0041' and uchar <= u'\u005a') or (uchar >= u'\u0061' and uchar <= u'\u007a'):
  return True
 else:
  return False
def format_str(content):
 content = unicode(content,'utf-8')
 content_str = ''
 for i in content:
  if is_chinese(i):
   content_str = content_str+i
 return content_str
basic_str = '<img src="http://i1.go2yd.com/image.php?url=0Hd0FkcQse" />迪丽热巴自从签约杨幂工作室,就呈炮竹式的一路走红,特别是参演《三生三世十里桃花》和综艺节目“奔跑吧兄弟”之后,迪丽热巴的人气更是一路看涨,尤其是她在“奔跑吧兄弟”里吃货的人设更是深入人心。<img src="http://i1.go2yd.com/image.php?url=0Hd0Fk47Dk" /><img src="http://i1.go2yd.com/image.php?url=0Hd0FkM0u2" />近日,迪丽热巴和张彬彬的新戏《秦时丽人明月心》刚刚热映完,张彬彬的采访被网友挖出,张彬彬说,迪丽热巴从跑男回来之后,体重明星飙升,之前拍戏的时候能轻轻松松的抱着热巴。但是跑男之后,抱上几秒就感觉很吃力了。万万没想到啊,跑男难道不是一个体力类节目吗?热巴硬生生给发展成美食节目了。<img src="http://i1.go2yd.com/image.php?url=0Hd0FkHVHW" />更心酸的是,张彬彬实在抱不动了,导演也看不下去了,就说:”让替身上吧!“后来那段戏就是用的迪丽热巴的替身。看来,热巴是该留意一下自己的体重了,虽然外表看不出来胖,但真要发现胖了,对于演员来说,就是致命一击啊。不过,吃货的世界,可能就甘愿承担这样的痛吧。<img src="http://i1.go2yd.com/image.php?url=0Hd0Fktm1y" />本文为一点号作者原创,未经授权不得转载'
basic_str = format_str(basic_str)
print basic_str

以上这篇python 字符串只保留汉字的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python远程桌面协议RDPY安装使用介绍

RDPY 是基于 Twisted Python 实现的微软 RDP 远程桌面协议。 RDPY 提供了如下 RDP 和 VNC 支持: ●RDP Man In The Middle pro...

在Python 不同级目录之间模块的调用方法

Python的模块有自带的也有第三方,还可以自定义然后引用 1、调用自带的模块,例如,sys 调用自带的模块只需要import sys 引入既可以使用 2、第三方的需要先安装模块然后再i...

简单了解Django应用app及分布式路由

简单了解Django应用app及分布式路由

前言 应用在Django的项目中是一个独立的业务模块,可以包含自己的路由,视图,模板,模型. 一 创建应用程序 创建步骤 用manage.py中的子命令startapp创建应用文件夹...

使用python打印十行杨辉三角过程详解

使用python打印十行杨辉三角过程详解

杨辉三角,是二项式系数在三角形中的一种几何排列 每个数等于它上方两数之和。 每行数字左右对称,由1开始逐渐变大。 第n行的数字有n项。 第n行数字和为2n-1。 第...

python去除拼音声调字母,替换为字母的方法

第一种方法 import sys import unicodedata s = "Lǐ Zhōu Wú" remap = { # ord返回ascii值 ord('\t'): '...