python爬虫教程之爬取百度贴吧并下载的示例

yipeiwu_com6年前 (2020-03-06)Python爬虫

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url： \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))

baidu_tieba(bdurl,begin_page,end_page)

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python爬虫爬取淘宝商品信息

本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下 import requests as req import re def getHTMLT...

Python正则抓取新闻标题和链接的方法示例

本文实例讲述了Python正则抓取新闻标题和链接的方法。分享给大家供大家参考，具体如下： #-*-coding:utf-8-*- import re from urllib impo...

Python 爬虫模拟登陆知乎

在之前写过一篇使用python爬虫爬取电影天堂资源的文章，重点是如何解析页面和提高爬虫的效率。由于电影天堂上的资源获取权限是所有人都一样的，所以不需要进行登录验证操作，写完那篇文章后又花...

浅谈Scrapy网络爬虫框架的工作原理和数据采集

今天小编给大家详细的讲解一下Scrapy爬虫框架，希望对大家的学习有帮助。 1、Scrapy爬虫框架 Scrapy是一个使用Python编程语言编写的爬虫框架，任何人都可以根据自己的需求...

零基础写python爬虫之爬虫框架Scrapy安装配置

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识，用来解决简单的贴吧下载，绩点运算自然不在话下。不过要想批量下载大量的内容，比如知乎的所有的问答，那便显得游刃不有余了点。...

宜配屋

python爬虫教程之爬取百度贴吧并下载的示例

相关文章

python爬虫爬取淘宝商品信息

Python正则抓取新闻标题和链接的方法示例

Python 爬虫模拟登陆知乎

浅谈Scrapy网络爬虫框架的工作原理和数据采集

零基础写python爬虫之爬虫框架Scrapy安装配置

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python爬虫教程之爬取百度贴吧并下载的示例

相关文章

python爬虫爬取淘宝商品信息

Python正则抓取新闻标题和链接的方法示例

Python 爬虫模拟登陆知乎

浅谈Scrapy网络爬虫框架的工作原理和数据采集

零基础写python爬虫之爬虫框架Scrapy安装配置

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号