python使用htmllib分析网页内容的方法

yipeiwu_com5年前Python基础

本文实例讲述了python使用htmllib分析网页内容的方法。分享给大家供大家参考。具体实现方法如下:

import htmllib, urllib, formatter, sys
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout))
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
ptext.close()

希望本文所述对大家的Python程序设计有所帮助。

相关文章

Python SELENIUM上传文件或图片实现过程

Python SELENIUM上传文件或图片实现过程

逛网站的时候经常会遇到需要上传图片的操作,这里主要来说下selenium操作上传文件的操作。 前提条件:定位的元素必须是type 属性是file类型。即type="file",如下图:...

Flask中endpoint的理解(小结)

在flask框架中,我们经常会遇到endpoint这个东西,最开始也没法理解这个到底是做什么的。最近正好在研究Flask的源码,也就顺带了解了一下这个endpoint 首先,我们看一个...

Pandas中DataFrame的分组/分割/合并的实现

Pandas中DataFrame的分组/分割/合并的实现

学习《Python3爬虫、数据清洗与可视化实战》时自己的一些实践。 DataFrame分组操作 注意分组后得到的就是Series对象了,而不再是DataFrame对象。 import...

详解python中的数据类型和控制流

上一篇文章中我们介绍了 python 语言的几个特点,并在最后留了一个问题,python 除了上下执行以外有没有其他的执行方式。 今天我们就来介绍 python 中的数据类型和控制流。...

Python赋值语句后逗号的作用分析

本文实例讲述了Python赋值语句后逗号的作用。分享给大家供大家参考。具体分析如下: IDLE 2.6.2 >>> a = 1 >>> b =...