Python获取网页上图片下载地址的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python获取网页上图片下载地址的方法。分享给大家供大家参考。具体如下:

这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下:

复制代码 代码如下:
#!/user/bin/python3
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
    links = []
    def handle_starttag(self, tag, attrs):
        if tag == "img":
            if len(attrs) == 0:
                pass
            else:
                for name, value in attrs:
                    if name == "src":
                        self.links.append(value)
if __name__ == "__main__":
    uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
    file = urllib2.urlopen(uri).read()
    # file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
    hy = MyHtmlParser()
    hy.feed(file)
    hy.close()
    print(hy.links)

希望本文所述对大家的Python程序设计有所帮助。

相关文章

简单了解python 邮件模块的使用方法

我们在开发程序的时候,有时候需要开发一些自动化的任务,执行完之后,将结果自动的发送一份邮件,python发送邮件使用smtplib模块,是一个标准包,直接import导入使用即可,代码如...

pyenv与virtualenv安装实现python多版本多项目管理

pyenv与virtualenv安装实现python多版本多项目管理

踩了很多坑,记录一下这次试验,本次测试环境:Linux centos7 64位。 pyenv是一个python版本管理工具,它能够进行全局的python版本切换,也可以为单个项目提供对应...

Python中的time模块与datetime模块用法总结

time模块 time模块是包含各方面对时间操作的函数. 尽管这些常常有效但不是所有方法在任意平台中有效. time用struct_time表示时间 import time # t...

网站渗透常用Python小脚本查询同ip网站

网站渗透常用Python小脚本查询同ip网站

旁站查询来源: http://dns.aizhan.com http://s.tool.chinaz.com/same http://i.links.cn/sameip/ http://...

详解python运行三种方式

方式一 交互式编程 交互式编程不需要创建脚本文件,是通过 Python 解释器的交互模式进来编写代码。 linux上你只需要在命令行中输入 Python 命令即可启动交互式编程,提示窗口...