Python lxml解析HTML并用xpath获取元素的方法

yipeiwu_com6年前 (2020-03-06)Python基础

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性：%s" % p.attrib
  print u"文本：%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Django REST framework 分页的实现代码

官方文档[这里] 用于分页的模块: Pagination Django REST framework 有内置 Pagination 模块，无需额外安装, 只需做简单的配置. 配置什么呢&...

用python制作游戏外挂

玩过电脑游戏的同学对于外挂肯定不陌生，但是你在用外挂的时候有没有想过如何做一个外挂呢？（当然用外挂不是那么道义哈，呵呵），那我们就来看一下如何用python来制作一个外挂。。。。我打开...

3个用于数据科学的顶级Python库

Python有许多吸引力，如效率，代码可读性和速度，使其成为数据科学爱好者的首选编程语言。Python通常是希望升级其应用程序功能的数据科学家和机器学习专家的首选。由于其广泛的用途，P...

Python实现TCP/IP协议下的端口转发及重定向示例

首先，我们用webpy写一个简单的网站，监听8080端口，返回“Hello, EverET.org”的页面。然后我们使用我们的forwarding.py，在80端口和8080端口中间建...

浅谈用Python实现一个大数据搜索引擎

搜索是大数据领域里常见的需求。Splunk和ELK分别是该领域在非开源和开源领域里的领导者。本文利用很少的Python代码实现了一个基本的数据搜索功能，试图让大家理解大数据搜索的基本原理...

宜配屋

Python lxml解析HTML并用xpath获取元素的方法

相关文章

Django REST framework 分页的实现代码

用python制作游戏外挂

3个用于数据科学的顶级Python库

Python实现TCP/IP协议下的端口转发及重定向示例

浅谈用Python实现一个大数据搜索引擎

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python lxml解析HTML并用xpath获取元素的方法

相关文章

Django REST framework 分页的实现代码

用python制作游戏外挂

3个用于数据科学的顶级Python库

Python实现TCP/IP协议下的端口转发及重定向示例

浅谈用Python实现一个大数据搜索引擎

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号