Python正则表达式匹配HTML页面编码

yipeiwu_com6年前 (2020-03-06)Python基础

html页面一般都会指定一个编码，如何获取到是处理html页面的第一步，因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个：

import re

a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
   '<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
   '<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
   ]



b = "<meta[ ]+http-equiv=["']?content-type["']?[ ]+content=["']?text/html;[ ]*charset=([0-9-a-zA-Z]+)["']?"


B = re.compile(b, re.IGNORECASE)


for ax in a:
  r1 = B.search(ax)

  if r1:
    print r1.group()
    print r1.group(1), len(r1.group())
  else:
    print 'not match'

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

PyQt5实现从主窗口打开子窗口的方法

1.在Qt Designer中设计两个简单窗口 2.将.ui文件转换成.py文件 3.新建**.py文件 #-*- coding:utf-8 -*- from PyQt5.QtWi...

插入排序_Python与PHP的实现版(推荐)

插入排序Python实现 import random a=[random.randint(1,999) for x in range(0,36)] # 直接插入排序算法 def...

idea创建springMVC框架和配置小文件的教程图解

这个框架主要还是思想，之后，，，还是创建项目好了， 1.新建一个项目新建一个maven，并且选择webapp类型。 2.点击next选项这里面的两个选项可以随便填，但是Artif...

python调用百度语音识别实现大音频文件语音识别功能

本文为大家分享了python实现大音频文件语音识别功能的具体代码，供大家参考，具体内容如下实现思路：先用ffmpeg将其他非wav格式的音频转换为wav格式，并转换音频的声道（百度支持...

Python中实现的RC4算法

闲暇之时，用Python实现了一下RC4算法编码 UTF-8 class 方式 #/usr/bin/python #coding=utf-8 import sys,os,hash...

宜配屋

Python正则表达式匹配HTML页面编码

相关文章

PyQt5实现从主窗口打开子窗口的方法

插入排序_Python与PHP的实现版(推荐)

idea创建springMVC框架和配置小文件的教程图解

python调用百度语音识别实现大音频文件语音识别功能

Python中实现的RC4算法

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python正则表达式匹配HTML页面编码

相关文章

PyQt5实现从主窗口打开子窗口的方法

插入排序_Python与PHP的实现版(推荐)

idea创建springMVC框架和配置小文件的教程图解

python调用百度语音识别实现大音频文件语音识别功能

Python中实现的RC4算法

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号