python使用正则表达式分析网页中的图片并进行替换的方法

yipeiwu_com6年前Python基础

本文实例讲述了python使用正则表达式分析网页中的图片并进行替换的方法。分享给大家供大家参考。具体分析如下:

这段代码分析网页中的所有图片表单<img>,分析后为其前后添加相应的修饰标签,并添加到图片的超级链接。

复制代码 代码如下:
result = value.replace("[ page ]","").replace('  ',u' ')
p=re.compile(r'''(<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*["']?[\s\t\r\n]*([^\s\t\r\n"'<>]*)[^<>]*?/?[\s\t\r\n]*>)''',re.IGNORECASE)
result = p.sub(r'''<span class="openIcon"><em></em><a href="\2">\1</a></span>''',result)

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python 3.3 下载固定链接文件并保存的方法

python 3.3 下载固定链接文件并保存。 import urllib.request print ("downloading with urllib") url = '/zb_...

Django的models模型的具体使用

model的常用字段 V=models.CharField(max_length=None[, **options])    #varchar V=models.EmailFiel...

python将文本转换成图片输出的方法

本文实例讲述了python将文本转换成图片输出的方法。分享给大家供大家参考。具体实现方法如下: #-*- coding:utf-8 -*- from PIL import Image...

python插入排序算法实例分析

本文实例讲述了python插入排序算法。分享给大家供大家参考。具体如下: def insertsort(array): for removed_index in range(1...

python 获取utc时间转化为本地时间的方法

方法一: import datetime timenow = (datetime.datetime.utcnow() + datetime.timedelta(hours=8))...