python 字符串只保留汉字的方法

yipeiwu_com5年前Python基础

如下所示:

def is_chinese(uchar):
 """判断一个unicode是否是汉字"""
 if uchar >= u'\u4e00' and uchar <= u'\u9fa5':
  return True
 else:
  return False

def is_number(uchar):
 """判断一个unicode是否是数字"""
 if uchar >= u'\u0030' and uchar <= u'\u0039':
  return True
 else:
  return False

def is_alphabet(uchar):
 """判断一个unicode是否是英文字母"""
 if (uchar >= u'\u0041' and uchar <= u'\u005a') or (uchar >= u'\u0061' and uchar <= u'\u007a'):
  return True
 else:
  return False
def format_str(content):
 content = unicode(content,'utf-8')
 content_str = ''
 for i in content:
  if is_chinese(i):
   content_str = content_str+i
 return content_str
basic_str = '<img src="http://i1.go2yd.com/image.php?url=0Hd0FkcQse" />迪丽热巴自从签约杨幂工作室,就呈炮竹式的一路走红,特别是参演《三生三世十里桃花》和综艺节目“奔跑吧兄弟”之后,迪丽热巴的人气更是一路看涨,尤其是她在“奔跑吧兄弟”里吃货的人设更是深入人心。<img src="http://i1.go2yd.com/image.php?url=0Hd0Fk47Dk" /><img src="http://i1.go2yd.com/image.php?url=0Hd0FkM0u2" />近日,迪丽热巴和张彬彬的新戏《秦时丽人明月心》刚刚热映完,张彬彬的采访被网友挖出,张彬彬说,迪丽热巴从跑男回来之后,体重明星飙升,之前拍戏的时候能轻轻松松的抱着热巴。但是跑男之后,抱上几秒就感觉很吃力了。万万没想到啊,跑男难道不是一个体力类节目吗?热巴硬生生给发展成美食节目了。<img src="http://i1.go2yd.com/image.php?url=0Hd0FkHVHW" />更心酸的是,张彬彬实在抱不动了,导演也看不下去了,就说:”让替身上吧!“后来那段戏就是用的迪丽热巴的替身。看来,热巴是该留意一下自己的体重了,虽然外表看不出来胖,但真要发现胖了,对于演员来说,就是致命一击啊。不过,吃货的世界,可能就甘愿承担这样的痛吧。<img src="http://i1.go2yd.com/image.php?url=0Hd0Fktm1y" />本文为一点号作者原创,未经授权不得转载'
basic_str = format_str(basic_str)
print basic_str

以上这篇python 字符串只保留汉字的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

给大家整理了19个pythonic的编程习惯(小结)

Python最大的优点之一就是语法简洁,好的代码就像伪代码一样,干净、整洁、一目了然。 要写出 Pythonic(优雅的、地道的、整洁的)代码,需要多看多学大牛们写的代码,github...

python读取json文件并将数据插入到mongodb的方法

本文实例讲述了python读取json文件并将数据插入到mongodb的方法。分享给大家供大家参考。具体实现方法如下: #coding=utf-8 import sunburnt i...

Django中使用locals()函数的技巧

对 current_datetime 的一次赋值操作: def current_datetime(request): now = datetime.datetime.now()...

Python正则表达式如何进行字符串替换实例

Python正则表达式在使用中会经常应用到字符串替换的代码。有很多人都不知道如何解决这个问题,下面的代码就告诉你其实这个问题无比的简单,希望你有所收获。 1.替换所有匹配的子串用news...

python去除拼音声调字母,替换为字母的方法

第一种方法 import sys import unicodedata s = "Lǐ Zhōu Wú" remap = { # ord返回ascii值 ord('\t'): '...