python分析网页上所有超链接的方法

yipeiwu_com6年前Python基础

本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:

import urllib, htmllib, formatter
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.NullWriter())
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
for link in ptext.anchorlist:
  print(link)

希望本文所述对大家的Python程序设计有所帮助。

相关文章

Python 3.6 中使用pdfminer解析pdf文件的实现

Python 3.6 中使用pdfminer解析pdf文件的实现

所使用python环境为最新的3.6版本 一、安装pdfminer模块 安装anaconda后,直接可以通过pip安装 pip install pdfminer3k  ...

浅谈python正则的常用方法 覆盖范围70%以上

浅谈python正则的常用方法 覆盖范围70%以上

上一次很多朋友写文字屏蔽说到要用正则表达,其实不是我不想用(我正则用得不是很多,看过我之前爬虫的都知道,我直接用BeautifulSoup的网页标签去找内容,因为容易理解也方便,),而是...

python中日志logging模块的性能及多进程详解

python中日志logging模块的性能及多进程详解

前言 Java 中最通用的日志模块莫过于 Log4j 了,在 python 中,也自带了 logging 模块,该模块的用法其实和 Log4j 类似。日志是记录操作的一种好方式。但是日...

python实现的生成word文档功能示例

python实现的生成word文档功能示例

本文实例讲述了python实现的生成word文档功能。分享给大家供大家参考,具体如下: 每月1次的测试费用报销,需要做一个文档。干脆花点时间写个程序吧。 # -*- coding:...

python教程之用py2exe将PY文件转成EXE文件

一、简介 py2exe已经被用于创建wxPython,Tkinter,Pmw,PyGTK,pygame,win32com client和server,和其它的独立程序。py2exe是发布...