python去除所有html标签的方法

yipeiwu_com6年前Python基础

本文实例讲述了python去除所有html标签的方法。分享给大家供大家参考。具体分析如下:

这段代码可以用于去除文本里的字符串标签,不包括标签里面的内容

import re
html='<a href="//www.jb51.net">【听图阁-专注于Python设计】</a>,Python学习!'
dr = re.compile(r'<[^>]+>',re.S)
dd = dr.sub('',html)
print(dd)

运行结果如下:

【听图阁-专注于Python设计】,Python学习!

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python结合shell查询google关键词排名的实现代码

python结合shell查询google关键词排名的实现代码

最近老婆大人的公司给老婆大人安排了一个根据关键词查询google网站排名的差事。老婆大人的公司是做seo的,查询的关键词及网站特别的多,看着老婆大人这么辛苦的重复着查询工作,心疼啊。所以...

PyTorch中permute的用法详解

permute(dims) 将tensor的维度换位。 参数:参数是一系列的整数,代表原来张量的维度。比如三维就有0,1,2这些dimension。 例: import tor...

Python字符串的encode与decode研究心得乱码问题解决方法

为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not...

Python随机生成一个6位的验证码代码分享

1. 生成源码 复制代码 代码如下: # -*- coding: utf-8 -*- import random def generate_verification_code(): &n...

python的迭代器与生成器实例详解

本文以实例详解了python的迭代器与生成器,具体如下所示: 1. 迭代器概述:   迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问...