python获取指定网页上所有超链接的方法

yipeiwu_com6年前Python基础

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

相关文章

pyinstaller打包单个exe后无法执行错误的解决方法

1、执行环境说明 python版本3.7 直接使用pip进行安装pywin32、pyinstaller pip install pywin32 pip install pyinstall...

Cython编译python为so 代码加密示例

1. 编译出来的so比网上流传的其他方法小很多。 2. language_level  是python的主版本号,如果python版本是2.x,目前的版本Cython需要人工指...

使用 Python 清理收藏夹里已失效的网站

使用 Python 清理收藏夹里已失效的网站

失效的书签们 我们日常浏览网站的时候,时不时会遇到些新奇的东西( 你懂的.jpg ),于是我们就默默的点了个收藏或者加书签。然而当我们面对成百上千的书签和收藏夹的时候,总会头疼不已……...

Python使用struct处理二进制的实例详解

Python使用struct处理二进制的实例详解 有的时候需要用python处理二进制数据,比如,存取文件,socket操作时.这时候,可以使用python的struct模块来完成.可以...

python实现dict版图遍历示例

复制代码 代码如下:#_*_coding:utf_8_import sysimport os class Graph():    def __init__(...