python获取指定网页上所有超链接的方法

yipeiwu_com5年前 (2020-03-06)Python基础

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下：

这段python代码通过urllib2抓取网页，然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

详解flask表单提交的两种方式

一.通用方式通用方式就是使用ajax或者$.post来提交。前端html <form method="post" action="/mockservice" meth...

基于django ManyToMany 使用的注意事项详解

使用场景一：如果在一张表中ManayTOManay字段关联的是自身，也就是出项这样的代码： ManyToManyField(self) 那么，你需要注意一点，当你采用add方法将一个自...

python字典改变value值方法总结

今天这篇文章中我们来了解一下python之中的字典，在这文章之中我会对python字典修改进行说明,以及举例说明如何修改python字典内的值。废话不多说，我们开始进入文章吧。首先我们...

Python Django框架单元测试之文件上传测试示例

本文实例讲述了Python Django框架单元测试之文件上传测试。分享给大家供大家参考，具体如下： Submitting files is a special case. To POS...

Python 内置函数进制转换的用法(十进制转二进制、八进制、十六进制)

使用Python内置函数：bin()、oct()、int()、hex()可实现进制转换。先看Python官方文档中对这几个内置函数的描述： bin(x) Convert an inte...

宜配屋

python获取指定网页上所有超链接的方法

相关文章

详解flask表单提交的两种方式

基于django ManyToMany 使用的注意事项详解

python字典改变value值方法总结

Python Django框架单元测试之文件上传测试示例

Python 内置函数进制转换的用法(十进制转二进制、八进制、十六进制)

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python获取指定网页上所有超链接的方法

相关文章

详解flask表单提交的两种方式

基于django ManyToMany 使用的注意事项详解

python字典改变value值方法总结

Python Django框架单元测试之文件上传测试示例

Python 内置函数进制转换的用法(十进制转二进制、八进制、十六进制)

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号