python获取指定网页上所有超链接的方法

yipeiwu_com6年前Python基础

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

相关文章

Python+tkinter使用80行代码实现一个计算器实例

Python+tkinter使用80行代码实现一个计算器实例

本文主要探索的是使用Python+tkinter编程实现一个简单的计算器代码示例,具体如下。 闲话不说,直奔主题。建议大家跟着敲一遍代码,体会一下代码复用、字符串方法的运用和动态创建组件...

浅谈python 导入模块和解决文件句柄找不到问题

如果你退出 Python 解释器并重新进入,你做的任何定义(变量和方法)都会丢失。因此,如果你想要编写一些更大的程序,为准备解释器输入使用一个文本编辑器会更好,并以那个文件替代作为输入执...

python实现五子棋游戏(pygame版)

python实现五子棋游戏(pygame版)

本文实例为大家分享了python五子棋游戏的具体代码,供大家参考,具体内容如下 目录 简介 实现过程 结语 简介 使用python实现pygame版的五子棋游戏...

简单了解python装饰器原理及使用方法

这篇文章主要介绍了简单了解python装饰器原理及使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 如果你接触 Python 有...

pymongo实现多结果进行多列排序的方法

本文实例讲述了pymongo实现多结果进行多列排序的方法。分享给大家供大家参考。具体分析如下: 这里多列排序即指定多个排序字段。 集合查询结果排序 复制代码 代码如下:>>&...