python根据unicode判断语言类型实例代码

yipeiwu_com5年前Python基础

本文实例主要实现的是python根据unicode判断语言类型,具体如下。

实例代码:

def is_chinese(uchar): 
"""判断一个unicode是否是汉字""" 
  if uchar >= u'\u4e00' and uchar<=u'\u9fa5': 
    return True 
  else: 
    return False 
 
def is_number(uchar): 
"""判断一个unicode是否是数字""" 
  if uchar >= u'\u0030' and uchar<=u'\u0039': 
    return True 
  else: 
    return False 
 
def is_alphabet(uchar): 
"""判断一个unicode是否是英文字母""" 
  if (uchar >= u'\u0041' and uchar<=u'\u005a') or (uchar >= u'\u0061' and uchar<=u'\u007a'): 
    return True 
  else: 
    return False 
 
def is_other(uchar): 
"""判断是否非汉字,数字和英文字符""" 
  if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)): 
    return True 
  else: 
    return False 
 
def B2Q(uchar): 
"""半角转全角""" 
  inside_code=ord(uchar) 
  if inside_code<0x0020 or inside_code>0x7e: #不是半角字符就返回原来的字符 
    return uchar 
  if inside_code==0x0020: #除了空格其他的全角半角的公式为:半角=全角-0xfee0 
    inside_code=0x3000 
  else: 
    inside_code+=0xfee0 
  return unichr(inside_code) 
 
def Q2B(uchar): 
"""全角转半角""" 
  inside_code=ord(uchar) 
  if inside_code==0x3000: 
    inside_code=0x0020 
  else: 
    inside_code-=0xfee0 
  if inside_code<0x0020 or inside_code>0x7e: #转完之后不是半角字符返回原来的字符 
    return uchar 
  return unichr(inside_code) 
 
def stringQ2B(ustring): 
"""把字符串全角转半角""" 
  return "".join([Q2B(uchar) for uchar in ustring]) 
 
def uniform(ustring): 
"""格式化字符串,完成全角转半角,大写转小写的工作""" 
  return stringQ2B(ustring).lower() 
 
def string2List(ustring): 
"""将ustring按照中文,字母,数字分开""" 
retList=[] 
utmp=[] 
for uchar in ustring: 
if is_other(uchar): 
if len(utmp)==0: 
continue 
else: 
retList.append("".join(utmp)) 
utmp=[] 
else: 
utmp.append(uchar) 
if len(utmp)!=0: 
retList.append("".join(utmp)) 
return retList 

总结

以上就是本文关于python根据unicode判断语言类型实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

相关文章

解决pycharm最左侧Tool Buttons显示不全的问题

解决pycharm最左侧Tool Buttons显示不全的问题

问题描述如下: 解决方案如下: 下图中字体调整为18及以上 效果如下: 以上这篇解决pycharm最左侧Tool Buttons显示不全的问题就是小编分享给大家的全部内容了,希望能...

Python采集腾讯新闻实例

Python采集腾讯新闻实例

目标是把腾讯新闻主页上所有新闻爬取下来,获得每一篇新闻的名称、时间、来源以及正文。 接下来分解目标,一步一步地做。 步骤1:将主页上所有链接爬取出来,写到文件里。 python在获取ht...

Python实现监控键盘鼠标操作示例【基于pyHook与pythoncom模块】

Python实现监控键盘鼠标操作示例【基于pyHook与pythoncom模块】

本文实例讲述了Python实现监控键盘鼠标操作。分享给大家供大家参考,具体如下: # -*- coding: utf-8 -*- import pythoncom import py...

python 数据提取及拆分的实现代码

python 数据提取及拆分的实现代码

K线数据提取 依据原有数据集格式,按要求生成新表: 1、每分钟的close数据的第一条、最后一条、最大值及最小值, 2、每分钟vol数据的增长量(每分钟vol的最后一条数据减第一条数据...

Python 变量类型详解

Python 变量类型详解

变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。 基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。 因此,变量可以指定不同的数据类型,这些...