python BeautifulSoup设置页面编码的方法

yipeiwu_com7年前 (2020-03-06)Python基础

在用BeautifulSoup进行抓取页面的时候，会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码，解决问题。

import urllib2  

from BeautifulSoup import BeautifulSoup  

page = urllib2.urlopen('http://www.163.com');  

soup = BeautifulSoup(page,from_encoding="gb2312")  

print soup.originalEncoding

print soup.prettify()

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题，当然具体参数值是什么就要看你获取页面的编码是什么

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python并发编程之线程实例解析

常用用法 t.is_alive() Python中线程会在一个单独的系统级别线程中执行（比如一个POSIX线程或者一个Windows线程）这些线程将由操作系统来全权管理。线程一旦启动，...

django基础之数据库操作方法(详解)

Django 自称是“最适合开发有限期的完美WEB框架”。本文参考《Django web开发指南》，快速搭建一个blog 出来，在中间涉及诸多知识点，这里不会详细说明，如果你是第一次接触...

Python实现按当前日期（年、月、日）创建多级目录的方法

先看实际效果，现在时间2018.4.26 使用python脚本按照年月日生成多级目录，创建的目录可以将系统生成的日志文件放入其中，方便查阅，代码如下： #!/usr/bin/env...

详解Python3的TFTP文件传输

TFTP文件传输功能： 1、获取文件列表 2、上传文件 3、下载文件 4、退出第一部分，TftpServer部分。 ①导入相关模块 from socket import * im...

Numpy 改变数组维度的几种方法小结

来自《Python数据分析基础教程：Numpy 学习指南（第2版）》 Numpy改变数组维度的方法有： reshape() ravel() flatten() 用元组设置维度...

宜配屋

python BeautifulSoup设置页面编码的方法

相关文章

python并发编程之线程实例解析

django基础之数据库操作方法(详解)

Python实现按当前日期（年、月、日）创建多级目录的方法

详解Python3的TFTP文件传输

Numpy 改变数组维度的几种方法小结

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python BeautifulSoup设置页面编码的方法

相关文章

python并发编程之线程实例解析

django基础之数据库操作方法(详解)

Python实现按当前日期（年、月、日）创建多级目录的方法

详解Python3的TFTP文件传输

Numpy 改变数组维度的几种方法小结

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号