python实现网页链接提取的方法分享

yipeiwu_com6年前 (2020-03-06)Python基础

#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter())  
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close() 

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

分析Python读取文件时的路径问题

Python在读取文件内容时的路径问题，值得深究一下.我想讨论的重点还是在绝对路径上面.在这之前我们先看一下 1：相对路径这张图演示了在相对路径下寻找查找指定文件. ...

浅谈Python的Django框架中的缓存控制

关于缓存剩下的问题是数据的隐私性以及在级联缓存中数据应该在何处储存的问题。通常用户将会面对两种缓存：他或她自己的浏览器缓存（私有缓存）以及他或她的提供者缓存（公共缓存）。公共缓存由...

python单例模式实例解析

本文实例为大家分享了python单例模式的具体代码，供大家参考，具体内容如下多次实例化的结果指向同一个实例单例模式实现方式方式一: import settings class...

Python删除Java源文件中全部注释的实现方法

本文实例讲述了Python删除Java源文件中全部注释的实现方法。分享给大家供大家参考，具体如下：同事想删除一个Java项目中的全部注释，让我帮忙想想办法。没找不到合适工具，就写了这...

快速解决pyqt5窗体关闭后子线程不同时退出的问题

用pyqt5设计了一个主窗体，在窗体运行时需要把一个无限循环放在一个线程去工作。运行后，发现通过鼠标按主窗体的关闭按键关闭主创体后，线程不会自动终止，依然在运行。尽管对我的使用场景来说，...

宜配屋

python实现网页链接提取的方法分享

相关文章

分析Python读取文件时的路径问题

浅谈Python的Django框架中的缓存控制

python单例模式实例解析

Python删除Java源文件中全部注释的实现方法

快速解决pyqt5窗体关闭后子线程不同时退出的问题

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python实现网页链接提取的方法分享

相关文章

分析Python读取文件时的路径问题

浅谈Python的Django框架中的缓存控制

python单例模式实例解析

Python删除Java源文件中全部注释的实现方法

快速解决pyqt5窗体关闭后子线程不同时退出的问题

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号