python3 爬取图片的实例代码

yipeiwu_com6年前Python爬虫

具体代码如下所示:

#coding=utf8
from urllib import request
import re
import urllib,os
url='http://tieba.baidu.com/p/3840085725'
def get_image(url):
  #获取页面源码
  page = urllib.request.urlopen(url)
  html = page.read()
  #解码,否则报错
  html = html.decode('utf8')
  #正则匹配获取()的内容
  reg = r'src="(https.+?.[jpg,png])"'
  imge = re.compile(reg)
  # 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list
  imglist = imge.findall(html)
  return imglist
def save_img(imglist):
  dir = os.path.join(os.path.dirname(__file__),'img')
  i=1
  for img in imglist:
    #python3格式化字符串的另一种写法
    imgpath = f'{dir}\\image{i}.jpg'
    try:
      #urlretrieve下载图片并保存到本地
      urllib.request.urlretrieve(img,imgpath)
      i += 1
      print(u'图片开始下载')
    except Exception:
      print(f'image:{img}下载失败')
      continue
imglist = get_image(url)
save_img(imglist)

总结

以上所述是小编给大家介绍的python3 爬取图片的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!

相关文章

Python抓取京东图书评论数据

 京东图书评论有非常丰富的信息,这里面就包含了购买日期、书名、作者、好评、中评、差评等等。以购买日期为例,使用Python + Mysql的搭配进行实现,程序不大,才100行。...

Python 正则表达式爬虫使用案例解析

现在拥有了正则表达式这把神兵利器,我们就可以进行对爬取到的全部网页源代码进行筛选了。 下面我们一起尝试一下爬取内涵段子网站: http://www.neihan8.com/articl...

Python实现爬取亚马逊数据并打印出Excel文件操作示例

Python实现爬取亚马逊数据并打印出Excel文件操作示例

本文实例讲述了Python实现爬取亚马逊数据并打印出Excel文件操作。分享给大家供大家参考,具体如下: python大神们别喷,代码写的很粗糙,主要是完成功能,能够借鉴就看下吧,我是学...

python实现博客文章爬虫示例

复制代码 代码如下:#!/usr/bin/python#-*-coding:utf-8-*-# JCrawler# Author: Jam <810441377@qq.com>...

python爬虫之遍历单个域名

即使你没听说过“维基百科六度分隔理论”,也很可能听过“凯文 • 贝肯 (Kevin Bacon)的六度分隔值游戏”。在这两个游戏中,目标都是把两 个不相干的主题(在前一种情况...