python3 爬取图片的实例代码

yipeiwu_com6年前Python爬虫

具体代码如下所示:

#coding=utf8
from urllib import request
import re
import urllib,os
url='http://tieba.baidu.com/p/3840085725'
def get_image(url):
  #获取页面源码
  page = urllib.request.urlopen(url)
  html = page.read()
  #解码,否则报错
  html = html.decode('utf8')
  #正则匹配获取()的内容
  reg = r'src="(https.+?.[jpg,png])"'
  imge = re.compile(reg)
  # 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list
  imglist = imge.findall(html)
  return imglist
def save_img(imglist):
  dir = os.path.join(os.path.dirname(__file__),'img')
  i=1
  for img in imglist:
    #python3格式化字符串的另一种写法
    imgpath = f'{dir}\\image{i}.jpg'
    try:
      #urlretrieve下载图片并保存到本地
      urllib.request.urlretrieve(img,imgpath)
      i += 1
      print(u'图片开始下载')
    except Exception:
      print(f'image:{img}下载失败')
      continue
imglist = get_image(url)
save_img(imglist)

总结

以上所述是小编给大家介绍的python3 爬取图片的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!

相关文章

Python爬虫实例_利用百度地图API批量获取城市所有的POI点

Python爬虫实例_利用百度地图API批量获取城市所有的POI点

上篇关于爬虫的文章,我们讲解了如何运用Python的requests及BeautifuiSoup模块来完成静态网页的爬取,总结过程,网页爬虫本质就两步: 1、设置请求参数(url,hea...

Python抓取框架Scrapy爬虫入门:页面提取

前言 Scrapy是一个非常好的抓取框架,它不仅提供了一些开箱可用的基础组建,还能够根据自己的需求,进行强大的自定义。本文主要给大家介绍了关于Python抓取框架Scrapy之页面提取的...

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1...

Python3爬虫学习之将爬取的信息保存到本地的方法详解

Python3爬虫学习之将爬取的信息保存到本地的方法详解

本文实例讲述了Python3爬虫学习之将爬取的信息保存到本地的方法。分享给大家供大家参考,具体如下: 将爬取的信息存储到本地 之前我们都是将爬取的数据直接打印到了控制台上,这样显然不利于...

python爬虫URL重试机制的实现方法(python2.7以及python3.5)

应用场景: 状态不是200的URL重试多次 代码比较简单还有部分注释 python2.7实现: # -*-coding:utf-8-*- """ ayou """ import...