python获取指定网页上所有超链接的方法

yipeiwu_com6年前Python基础

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

相关文章

Python编程argparse入门浅析

Python编程argparse入门浅析

本文研究的主要是Python编程argparse的相关内容,具体介绍如下。 #aaa.py #version 3.5 import os #这句是没用了,不知道为什么markd...

python根据距离和时长计算配速示例

复制代码 代码如下:function cal_pace(d,h,m,s){ var distance = d; var hours = h; var min...

Python Web框架之Django框架cookie和session用法分析

本文实例讲述了Python Web框架之Django框架cookie和session用法。分享给大家供大家参考,具体如下: part 1 概念 在Django里面,cookie和sess...

python mysqldb连接数据库

没办法就下了一个2.6,如果用2.4就太低了,又折腾了,半天找到了MySQL-python-1.2.2.win32-py2.6.exe 这个安装文件,安装完成,执行 import MyS...

Python中生成Epoch的方法

在Python2中datetime对象没有timestamp方法,不能很方便的生成epoch,现有方法没有处理很容易导致错误。关于Epoch可以参见时区与Epoch 0 Python中生...