python的xpath获取div标签内html内容,实现innerhtml功能的方法

yipeiwu_com5年前Python基础

python的xpath没有获取div标签内html内容的功能,也就是获取div或a标签中的innerhtml,写了个小程序实现一下:

源代码

[webadmin@centos7 csdnd4q] #162> vim /mywork/python/csdnd4q/z040.py       
#去掉最外层标签,保留其内的所有html标记和文本
def getinnerhtml(data):
 return data[data.find(">")+1:data.rfind("</")]
str1="<a>OK<b>[推荐]</b></a>"
print(getinnerhtml(str1))

运行代码

[webadmin@centos7 csdnd4q] #162> ./z040.py
OK<b>[推荐]</b>
[webadmin@centos7 csdnd4q] #163>

以上这篇python的xpath获取div标签内html内容,实现innerhtml功能的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python选择排序算法的实现代码

1.算法:对于一组关键字{K1,K2,…,Kn}, 首先从K1,K2,…,Kn中选择最小值,假如它是 Kz,则将Kz与 K1对换;然后从K2,K3,… ,Kn中选择最小值 Kz,再将Kz...

python datetime中strptime用法详解

python 中datetime中strptime用法,具体代码如下所示: import datetime day20 = datetime.datetime.strptime('2...

Python File(文件) 方法整理

open() 方法 Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。 注意:...

儿童python练习实例

实例一: 题目:有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少? 程序分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去 掉不满...

Python 匹配任意字符(包括换行符)的正则表达式写法

想使用正则表达式来获取一段文本中的任意字符,写出如下匹配规则: (.*) 结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换...