简单实现Python爬取网络图片

yipeiwu_com5年前Python爬虫

本文实例为大家分享了Python爬取网络图片的具体代码,供大家参考,具体内容如下

代码:

import urllib
import urllib.request
import re
#打开网页,下载器
def open_html ( url):
 require=urllib.request.Request(url)
 reponse=urllib.request.urlopen(require)
 html=reponse.read()
 return html
#下载图片
def load_image(html):
 regx='http://[\S]*jpg'
 pattern=re.compile(regx)
 get_image=re.findall(pattern,repr(html))

 num=1
 for img in get_image:
  photo=open_html(img)
  
  with open(r'E:\Photo\%s.jpg'%num,'wb') as f:
   print('开始下载图片')
   f.write(photo)
   print('正在下载第%s张图片'%num)
   f.close()
  num=num+1
 if num>1:
  print('下载成功!!!')
 else:
  print('下载失败!!!')

url='http://www.qiqipu.com/'
html=open_html(url)
load_image(html)

执行结果:

注意:

  在运行之前,必须要有路径(文件夹):E:\Photo\

  如果网站是HTTPS可以将正则中的http换为HTTPS,可以再定义一个下载图片的函数

  如果想要下载jpg、png、gif等多种格式的图片可以将正则中的jpg换为对应格式,也可以使用元组定义多种格式后遍历

我这里只要jpg就可以,就不改了,大家可以自己改下。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python编写百度贴吧的简单爬虫

操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数 功能:下载对应页码的所有页面并储存为HTML文件,以当前时间命名 代码: # -*- coding: utf-8...

python编写简单爬虫资料汇总

python编写简单爬虫资料汇总

  爬虫真是一件有意思的事儿啊,之前写过爬虫,用的是urllib2、BeautifulSoup实现简单爬虫,scrapy也有实现过。最近想更好的学习爬虫,那么就尽可能的做记录吧。这篇博客...

Python多线程爬虫实战_爬取糗事百科段子的实例

多线程爬虫:即程序中的某些程序段并行执行, 合理地设置多线程,可以让爬虫效率更高 糗事百科段子普通爬虫和多线程爬虫 分析该网址链接得出: https://www.qiushibaike....

Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容

Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容

1、引言 在Python网络爬虫内容提取器一文我们详细讲解了核心部件:可插拔的内容提取器类gsExtractor。本文记录了确定gsExtractor的技术路线过程中所做的编程实验。这是...

python实现爬虫统计学校BBS男女比例(一)

python实现爬虫统计学校BBS男女比例(一)

一、项目需求 前言:BBS上每个id对应一个用户,他们注册时候会填写性别(男、女、保密三选一)。 经过检查,BBS注册用户的id对应1-300000,大概是30万的用户 笔者想用Pyth...