Python抓取百度查询结果的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下：

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python爬虫框架scrapy实现的文件下载功能示例

本文实例讲述了Python爬虫框架scrapy实现的文件下载功能。分享给大家供大家参考，具体如下：我们在写普通脚本的时候，从一个网站拿到一个文件的下载url，然后下载，直接将数据写入文...

编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法

抓取豆瓣电影TOP100 一、分析豆瓣top页面，构建程序结构 1.首先打开网页http://movie.douban.com/top250?start，也就是top页面然后试...

Python3 使用selenium插件爬取苏宁商家联系电话

Selenium简介 Selenium是一个用于测试网站的自动化测试工具，支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器，同时也支持phantomJS无界...

python小技巧之批量抓取美女图片

其中用到urllib2模块和正则表达式模块。下面直接上代码： [/code]#!/usr/bin/env python#-*- coding: utf-8 -*-#通过urllib(2)...

Python爬虫实现爬取百度百科词条功能实例

本文实例讲述了Python爬虫实现爬取百度百科词条功能。分享给大家供大家参考，具体如下：爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。爬虫从一个或...

宜配屋

Python抓取百度查询结果的方法

相关文章

Python爬虫框架scrapy实现的文件下载功能示例

编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法

Python3 使用selenium插件爬取苏宁商家联系电话

python小技巧之批量抓取美女图片

Python爬虫实现爬取百度百科词条功能实例

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python抓取百度查询结果的方法

相关文章

Python爬虫框架scrapy实现的文件下载功能示例

编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法

Python3 使用selenium插件爬取苏宁商家联系电话

python小技巧之批量抓取美女图片

Python爬虫实现爬取百度百科词条功能实例

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号