python分析网页上所有超链接的方法

yipeiwu_com6年前Python基础

本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:

import urllib, htmllib, formatter
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.NullWriter())
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
for link in ptext.anchorlist:
  print(link)

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python使用pil生成缩略图的方法

本文实例讲述了python使用pil生成缩略图的方法。分享给大家供大家参考。具体分析如下: 这段代码实现python通过pil生成缩略图的功能,会强行将图片大小修改成250x156...

使用python生成目录树

这是一个使用Python生成文件、目录树的程序,其中遇到一个问题是:如何确定某个目录下的某一文件是最后一个遍历的文件。因为最后一个遍历的文件前应添加"└─",非最后一个文件前添加"├─"...

python使用minimax算法实现五子棋

这是一个命令行环境的五子棋程序。使用了minimax算法。 除了百度各个棋型的打分方式,所有代码皆为本人所撸。本程序结构与之前的井字棋、黑白棋一模一样。 有一点小问题,没时间弄了,就这样...

Python 字典与字符串的互转实例

字典转换为字符串 if __name__ == '__main__': a = {'a' : 1, 'b' : 2, 'c' : 3} b = str(a) print(...

Python内置random模块生成随机数的方法

本文我们详细地介绍下两个模块关于生成随机序列的其他使用方法。 随机数参与的应用场景大家一定不会陌生,比如密码加盐时会在原密码上关联一串随机数,蒙特卡洛算法会通过随机数采样等等。Pytho...