python爬虫教程之爬取百度贴吧并下载的示例

yipeiwu_com6年前 (2020-03-06)Python爬虫

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url： \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))

baidu_tieba(bdurl,begin_page,end_page)

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python爬虫包BeautifulSoup实例（三）

一步一步构建一个爬虫实例，抓取糗事百科的段子先不用beautifulsoup包来进行解析第一步，访问网址并抓取源码 # -*- coding: utf-8 -*- # @Auth...

Python 抓取动态网页内容方案详解

用Python实现常规的静态网页抓取时，往往是用urllib2来获取整个HTML页面，然后从HTML文件中逐字查找对应的关键字。如下所示：复制代码代码如下: import urlli...

python中数据爬虫requests库使用方法详解

一、什么是Requests Requests 是Python语编写，基于urllib，采Apache2 Licensed开源协议的 HTTP 库。它urllib 更加方便，可以节约我们大...

一步步教你用python的scrapy编写一个爬虫

介绍本文将介绍我是如何在python爬虫里面一步一步踩坑，然后慢慢走出来的，期间碰到的所有问题我都会详细说明，让大家以后碰到这些问题时能够快速确定问题的来源，后面的代码只是贴出了核心...

Python爬虫实现获取动态gif格式搞笑图片的方法示例

本文实例讲述了Python爬虫实现获取动态gif格式搞笑图片的方法。分享给大家供大家参考，具体如下：有时候看到一些喜欢的动图，如果一个个取保存挺麻烦，有的网站还不支持右键保存，因此使用...

宜配屋

python爬虫教程之爬取百度贴吧并下载的示例

相关文章

Python爬虫包BeautifulSoup实例（三）

Python 抓取动态网页内容方案详解

python中数据爬虫requests库使用方法详解

一步步教你用python的scrapy编写一个爬虫

Python爬虫实现获取动态gif格式搞笑图片的方法示例

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python爬虫教程之爬取百度贴吧并下载的示例

相关文章

Python爬虫包BeautifulSoup实例（三）

Python 抓取动态网页内容方案详解

python中数据爬虫requests库使用方法详解

一步步教你用python的scrapy编写一个爬虫

Python爬虫实现获取动态gif格式搞笑图片的方法示例

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号