python获取指定网页上所有超链接的方法

yipeiwu_com6年前Python基础

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

相关文章

Python使用python-docx读写word文档

Python使用python-docx读写word文档

python-docx库可用于创建和编辑Microsoft Word(.docx)文件。 官方文档:链接地址 备注: doc是微软的专有的文件格式,docx是Microsoft Offi...

详解python3中的真值测试

1. 真值测试 所谓真值测试,是指当一种类型对象出现在if或者while条件语句中时,对象值表现为True或者False。弄清楚各种情况下的真值对我们编写程序有重要的意义。 对于一个对...

python字典基本操作实例分析

本文实例讲述了python字典基本操作。分享给大家供大家参考。具体如下: d2 = {'spam': 2, 'ham': 1, 'eggs': 3} # make a diction...

python实现的正则表达式功能入门教程【经典】

本文讲述了python实现的正则表达式功能。分享给大家供大家参考,具体如下: 前文: 首先,什么叫正则表达式(Regular Expression)? 例如我们要判断字符串"adi_e3...

python切换hosts文件代码示例

win7以上需要使用管理员权限操作。复制代码 代码如下:# -*- coding: utf-8 -*-import osimport globimport shutil def form...