python3抓取中文网页的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了python3抓取中文网页的方法。分享给大家供大家参考。具体如下：

#! /usr/bin/python3.2
import sys
import urllib.request
req = urllib.request.Request('http://www.baidu.com')
response = urllib.request.urlopen(req)
the_page = response.read()
type = sys.getfilesystemencoding()
#转换成本地系统编码
print(the_page.decode(type))

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

相关文章

python正则匹配抓取豆瓣电影链接和评论代码分享

复制代码代码如下:import urllib.requestimport reimport time def movie(movieTag): ta...

利用Python抓取行政区划码的方法

前言国家统计局网站上有相对比较齐的行政区划码，对于一些网站来说这是非常基础的数据，所以写了个Python程序将这部分数据抓取下来。注意：抓取下来以后还要进行简单的人工的整理示例代码...

python爬虫模拟登录人人网过程解析

requests 提供了一个叫做session类，来实现客户端和服务端的会话保持使用方法 1.实例化一个session对象 2.让session发送get或者post请求 sess...

使用python实现抓取腾讯视频所有电影的爬虫

用python实现的抓取腾讯视频所有电影的爬虫 # -*- coding: utf-8 -*- import re import urllib2 from bs4import Bea...

Python利用Scrapy框架爬取豆瓣电影示例

Python利用Scrapy框架爬取豆瓣电影示例

本文实例讲述了Python利用Scrapy框架爬取豆瓣电影。分享给大家供大家参考，具体如下： 1、概念 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包...