python 每天如何定时启动爬虫任务(实现方法分享)

yipeiwu_com6年前 (2020-03-06)Python爬虫

python2.7环境下运行

安装相关模块

想要每天定时启动，最好是把程序放在linux服务器上运行，毕竟linux可以不用关机，即定时任务一直存活；

#coding:utf8
import datetime
import time
def doSth():
 # 把爬虫程序放在这个类里
 print(u'这个程序要开始疯狂的运转啦')
# 一般网站都是1:00点更新数据，所以每天凌晨一点启动
def main(h=1,m=0):
 while True:
  now = datetime.datetime.now()
  # print(now.hour, now.minute)
  if now.hour == h and now.minute == m:
   break
  # 每隔60秒检测一次
  time.sleep(60)
 doSth()
main()

以上这篇python 每天如何定时启动爬虫任务(实现方法分享)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python使用Mechanize模块编写爬虫的要点解析

mechanize是对urllib2的部分功能的替换，能够更好的模拟浏览器行为，在web访问控制方面做得更全面。结合beautifulsoup和re模块，可以有效的解析web...

python爬虫神器Pyppeteer入门及使用

前言提起selenium想必大家都不陌生，作为一款知名的Web自动化测试框架，selenium支持多款主流浏览器，提供了功能丰富的API接口，经常被我们用作爬虫工具来使用。但是sele...

用Python程序抓取网页的HTML信息的一个小实例

抓取网页数据的思路有好多种，一般有：直接代码请求http、模拟浏览器请求数据（通常需要登录验证）、控制浏览器实现数据抓取等。这篇不考虑复杂情况，放一个读取简单网页数据的小例子：目标数据...

python正则表达式爬取猫眼电影top100

用正则表达式爬取猫眼电影top100，具体内容如下 #!/usr/bin/python # -*- coding: utf-8 -*- import json # 快速导...

Python 爬虫图片简单实现

Python 爬虫图片简单实现经常在逛知乎，有时候希望把一些问题的图片集中保存起来。于是就有了这个程序。这是一个非常简单的图片爬虫程序，只能爬取已经刷出来的部分的图片。由于对这一部分内...

宜配屋

python 每天如何定时启动爬虫任务(实现方法分享)

相关文章

Python使用Mechanize模块编写爬虫的要点解析

python爬虫神器Pyppeteer入门及使用

用Python程序抓取网页的HTML信息的一个小实例

python正则表达式爬取猫眼电影top100

Python 爬虫图片简单实现

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python 每天如何定时启动爬虫任务(实现方法分享)

相关文章

Python使用Mechanize模块编写爬虫的要点解析

python爬虫神器Pyppeteer入门及使用

用Python程序抓取网页的HTML信息的一个小实例

python正则表达式爬取猫眼电影top100

Python 爬虫图片简单实现

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号