python处理中文编码和判断编码示例

yipeiwu_com6年前 (2020-03-06)Python基础

下面所说的都是针对python2.7

#coding:utf-8
#chardet 需要下载安装

import chardet
#抓取网页html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' or web_encoding == 'UTF-8':

html = html_1
else :
html = html_1.decode('gbk','ignore').encode('utf-8')

#有以上处理，整个html就不会是乱码。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python遍历zip文件输出名称时出现乱码问题的解决方法

本文实例讲述了Python遍历zip文件输出名称时出现乱码问题的解决方法。分享给大家供大家参考。具体如下： windows中使用python2.7遍历zip文件之后输出文件名等信息，co...

python学生信息管理系统（完整版）

本文是基于上一篇（python项目：学生信息管理系统（初版））进行了完善，并添加了新的功能。主要包括有：完善部分：输入错误；无数据查询等异常错误新的功能：文件的操作：文件的读写，...

Python 开发Activex组件方法

使用win32com模块开发window ActiveX的示例：（如果你还没有装win32com模块的话，请到http://python.net/crew/skippy/win32/Do...

Python aiohttp百万并发极限测试实例分析

本文实例讲述了Python aiohttp百万并发极限测试。分享给大家供大家参考，具体如下：本文将测试python aiohttp的极限，同时测试其性能表现，以分钟发起请求数作为指标。...

Python找出list中最常出现元素的方法

本文实例讲述了Python找出list中最常出现元素的方法。分享给大家供大家参考，具体如下：假设一个list中保存着各种元素，需要统计每个元素出现的个数，并打印出最常出现的前三个元素分...

宜配屋

python处理中文编码和判断编码示例

相关文章

Python遍历zip文件输出名称时出现乱码问题的解决方法

python学生信息管理系统（完整版）

Python 开发Activex组件方法

Python aiohttp百万并发极限测试实例分析

Python找出list中最常出现元素的方法

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python处理中文编码和判断编码示例

相关文章

Python遍历zip文件输出名称时出现乱码问题的解决方法

python学生信息管理系统（完整版）

Python 开发Activex组件方法

Python aiohttp百万并发极限测试实例分析

Python找出list中最常出现元素的方法

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号