python的xpath获取div标签内html内容,实现innerhtml功能的方法

yipeiwu_com5年前Python基础

python的xpath没有获取div标签内html内容的功能,也就是获取div或a标签中的innerhtml,写了个小程序实现一下:

源代码

[webadmin@centos7 csdnd4q] #162> vim /mywork/python/csdnd4q/z040.py       
#去掉最外层标签,保留其内的所有html标记和文本
def getinnerhtml(data):
 return data[data.find(">")+1:data.rfind("</")]
str1="<a>OK<b>[推荐]</b></a>"
print(getinnerhtml(str1))

运行代码

[webadmin@centos7 csdnd4q] #162> ./z040.py
OK<b>[推荐]</b>
[webadmin@centos7 csdnd4q] #163>

以上这篇python的xpath获取div标签内html内容,实现innerhtml功能的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python中的数学运算操作符使用进阶

Python中对象的行为是由它的类型 (Type) 决定的。所谓类型就是支持某些特定的操作。数字对象在任何编程语言中都是基础元素,支持加、减、乘、除等数学操作。 Python的数字对象有...

python sys,os,time模块的使用(包括时间格式的各种转换)

sys模块 sys.argv: 实现从程序外部向程序传递参数。 位置参数argv[0]代表py文件本身,运行方法 python xx.py 参数1,参数2 。。 self = s...

python使用PyCharm进行远程开发和调试

python使用PyCharm进行远程开发和调试

背景描述 有时候Python应用的代码在本地开发环境运行十分正常,但是放到线上以后却出现了莫名其妙的异常,经过再三排查以后还是找不到问题原因,于是就在想,要是可以在服务器环境中进行单步跟...

python使用sessions模拟登录淘宝的方式

之前想爬取一些淘宝的数据,后来发现需要登录,找了很多的资料,有个使用request的sessions加上cookie来登录的,cookie的获取在登录后使用开发者工具可以找到。不过这个登...

pandas 快速处理 date_time 日期格式方法

当数据很多,且日期格式不标准时的时候,如果pandas.to_datetime 函数使用不当,会使得处理时间变得很长,提升速度的关键在于format的使用。下面举例进行说明: 示例数据:...