python3 爬取图片的实例代码

yipeiwu_com5年前Python爬虫

具体代码如下所示:

#coding=utf8
from urllib import request
import re
import urllib,os
url='http://tieba.baidu.com/p/3840085725'
def get_image(url):
  #获取页面源码
  page = urllib.request.urlopen(url)
  html = page.read()
  #解码,否则报错
  html = html.decode('utf8')
  #正则匹配获取()的内容
  reg = r'src="(https.+?.[jpg,png])"'
  imge = re.compile(reg)
  # 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list
  imglist = imge.findall(html)
  return imglist
def save_img(imglist):
  dir = os.path.join(os.path.dirname(__file__),'img')
  i=1
  for img in imglist:
    #python3格式化字符串的另一种写法
    imgpath = f'{dir}\\image{i}.jpg'
    try:
      #urlretrieve下载图片并保存到本地
      urllib.request.urlretrieve(img,imgpath)
      i += 1
      print(u'图片开始下载')
    except Exception:
      print(f'image:{img}下载失败')
      continue
imglist = get_image(url)
save_img(imglist)

总结

以上所述是小编给大家介绍的python3 爬取图片的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!

相关文章

python抓取京东小米8手机配置信息

python抓取京东小米8手机配置信息

本文代码是使用python抓取京东小米8手机的配置信息 首先找到小米8商品的链接:https://item.jd.com/7437788.html 然后找到其配置信息的标签,我们找到其配...

python爬虫增加访问量的方法

看着自己少得可怜的访问量,突然有一个想用爬虫刷访问量的想法,主要也是抱着尝试的心态,学习学习。 其实市面上有一些软件可以代刷流量 比如 流量精灵,使用感确实比我们自己写的代码要好一些 第...

Python tornado队列示例-一个并发web爬虫代码分享

Queue Tornado的tornado.queue模块为基于协程的应用程序实现了一个异步生产者/消费者模式的队列。这与python标准库为多线程环境实现的queue模块类似。 一个协...

Python3爬虫学习之爬虫利器Beautiful Soup用法分析

Python3爬虫学习之爬虫利器Beautiful Soup用法分析

本文实例讲述了Python3爬虫学习之爬虫利器Beautiful Soup用法。分享给大家供大家参考,具体如下: 爬虫利器Beautiful Soup 前面一篇说到通过urllib.re...

python3使用requests模块爬取页面内容的实战演练

python3使用requests模块爬取页面内容的实战演练

1.安装pip 我的个人桌面系统用的linuxmint,系统默认没有安装pip,考虑到后面安装requests模块使用pip,所以我这里第一步先安装pip。 $ sudo apt i...