python3简单实现微信爬虫

yipeiwu_com5年前 (2020-03-06)Python爬虫

使用ghost.py 通过搜搜的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了，希望对大家学习Python能够有所帮助

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python实现抓取HTML网页并以PDF文件形式保存的方法

本文实例讲述了Python实现抓取HTML网页并以PDF文件形式保存的方法。分享给大家供大家参考，具体如下：一、前言今天介绍将HTML网页抓取下来，然后以PDF保存，废话不多说直接进...

python爬取酷狗音乐排行榜

本文为大家分享了python爬取酷狗音乐排行榜的具体代码，供大家参考，具体内容如下 #coding=utf-8 from pymongo import MongoClient im...

Python实现抓取百度搜索结果页的网站标题信息

比如，你想采集标题中包含“58同城”的SERP结果，并过滤包含有“北京”或“厦门”等结果数据。该Python脚本主要是实现以上功能。其中，使用BeautifulSoup来解析HTM...

玩转python爬虫之爬取糗事百科段子

大家好，前面入门已经说了那么多基础知识了，下面我们做几个实战项目来挑战一下吧。那么这次为大家带来，Python爬取糗事百科的小段子的例子。首先，糗事百科大家都听说过吧？糗友们发的搞笑的...

Python爬虫实战：分析《战狼2》豆瓣影评

刚接触python不久，做一个小项目来练练手。前几天看了《战狼2》，发现它在最新上映的电影里面是排行第一的，如下图所示。准备把豆瓣上对它的影评做一个分析。目标总览主要做了三件事：...

宜配屋

python3简单实现微信爬虫

相关文章

Python实现抓取HTML网页并以PDF文件形式保存的方法

python爬取酷狗音乐排行榜

Python实现抓取百度搜索结果页的网站标题信息

玩转python爬虫之爬取糗事百科段子

Python爬虫实战：分析《战狼2》豆瓣影评

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python3简单实现微信爬虫

相关文章

Python实现抓取HTML网页并以PDF文件形式保存的方法

python爬取酷狗音乐排行榜

Python实现抓取百度搜索结果页的网站标题信息

玩转python爬虫之爬取糗事百科段子

Python爬虫实战：分析《战狼2》豆瓣影评

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号