Python读取网页内容的方法

yipeiwu_com6年前 (2020-03-06)Python基础

本文实例讲述了Python读取网页内容的方法。分享给大家供大家参考。具体如下：

import urllib2
#encoding = utf-8
class Crawler:
  def main(self):
    #req = urllib2.Request('http://www.baidu.com/')
    #req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0)')
    #urllib2.socket.setdefaulttimeout(10) # 超时10秒
    #page = urllib2.urlopen(req)
    page = urllib2.urlopen('http://www.google.com', timeout=10)
    data = page.read()
    print data
    print len(data) #计算字节长度
if __name__ == '__main__':
  me=Crawler()
  me.main()

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

相关文章

bluepy 一款python封装的BLE利器简单介绍

bluepy 一款python封装的BLE利器简单介绍

1、bluepy 简介 bluepy 是github上一个很好的蓝牙开源项目，其地址在 LINK-1，其主要功能是用python实现linux上BLE的接口。 This is a p...

Django 使用logging打印日志的实例

Django使用python自带的logging 作为日志打印工具。简单介绍下logging。 logging 是线程安全的，其主要由4部分组成： Logger 用户使用的直接接口，将...

python实现聚类算法原理

python实现聚类算法原理

本文主要内容：聚类算法的特点聚类算法样本间的属性(包括，有序属性、无序属性)度量标准聚类的常见算法，原型聚类(主要论述K均值聚类)，层次聚类、密度聚类 K均值聚类...

python logging类库使用例子

一、简单使用复制代码代码如下: def TestLogBasic(): import logging l...

Python获取当前路径实现代码

Python获取当前路径实现代码 import os,sys 使用sys.path[0]、sys.argv[0]、os.getcwd()、os.path.abspath(__...