python使用正则表达式提取网页URL的方法

yipeiwu_com6年前 (2020-03-06)Python基础

本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下：

import re
import urllib
url="//www.jb51.net"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
 print i
else:
 print 'this is over'

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

JavaScript正则表达式在线测试工具：
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：
http://tools.jb51.net/regex/create_reg

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

django页面跳转问题及注意事项

1.页面跳转项目的urls: urlpatterns = [ url(r'^app/', include(('app.urls'),namespace='my_app')), ]...

Python程序中的观察者模式结构编写示例

察者模式定义定义了对象之间的一对多依赖，这样一来，当一个对象改变状态时，它的所有依赖都会收到通知并自动更新。观察者模式提供了一种对象设计，让主题和观察者之间松耦合。设计原则为了交互...

Python中数组,列表:冒号的灵活用法介绍(np数组,列表倒序)

让我们来看一个例子： import numpy as np x=np.array([[1,2,3],[5,6,7],[7,8,9]]) print(x) Out[64]: array...

python 转换 Javascript %u 字符串为python unicode的代码

web采集的数据为 %u6B63%u5F0F%u4EBA%u5458，需要读取并转换为python对象，想了下不调用Javascript去eval，只能自己翻译了。核心代码： i...

python 实现矩阵按对角线打印

如下所示： Description：将一个矩阵（二维数组）按对角线向右进行打印。（搜了一下发现好像是美团某次面试要求半小时手撕的题） Example: Input: [ [1,2,...

宜配屋

python使用正则表达式提取网页URL的方法

相关文章

django页面跳转问题及注意事项

Python程序中的观察者模式结构编写示例

Python中数组,列表:冒号的灵活用法介绍(np数组,列表倒序)

python 转换 Javascript %u 字符串为python unicode的代码

python 实现矩阵按对角线打印

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python使用正则表达式提取网页URL的方法

相关文章

django页面跳转问题及注意事项

Python程序中的观察者模式结构编写示例

Python中数组,列表:冒号的灵活用法介绍(np数组,列表倒序)

python 转换 Javascript %u 字符串为python unicode的代码

python 实现矩阵按对角线打印

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号