Python使用scrapy采集时伪装成HTTP/1.1的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

复制代码 代码如下:
DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件
复制代码 代码如下:
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class PageGetter(ScrapyHTTPPageGetter):
    def sendCommand(self, command, path):
        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))
class HTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python中的变量如何开辟内存

python中的变量如何开辟内存

python下的变量 不需要预先声明变量的类型,变量的类型和值在赋值的那一刻被初始化(声明和定义的过程一起完成) 在python中, 每一个变量在内存中创建,我们可以通过变量来查看内存中...

Python基于PyGraphics包实现图片截取功能的方法

本文实例讲述了Python基于PyGraphics包实现图片截取功能的方法。分享给大家供大家参考,具体如下: 先安安装PyGraphics包 (python import media模块...

Python3中的2to3转换工具使用示例

python3与python2的还是有诸多的不同,比如说在2中: 复制代码 代码如下: print "Hello,World!"  raw_input()  在...

学生信息管理系统Python面向对象版

本文实例为大家分享了python学生信息管理系统的具体代码,供大家参考,具体内容如下 """ 程序名称:学生信息管理系统 版本信息:0.1 开发者:飞宇 开始时间:...

Django给admin添加Action的步骤详解

Django给admin添加Action的步骤详解

前言 django 的 admin 是个非常方便的admin portal,可以根据自己的需要重写. 在使用Django自带的admin后台的时候,他提供了一些默认的指令可以对数据进行操...