python实现网页链接提取的方法分享

yipeiwu_com6年前Python基础

复制代码 代码如下:

#encoding:utf-8
import socket
import htmllib,formatter
def open_socket(host,servname):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    port=socket.getservbyname(servname)
    s.connect((host,port))
    return s
host=''
host=input('请输入网址\n')
mysocket=open_socket(host,'http')
message='GET http://%s/\n\n'%(host,)
mysocket.send(message)
file=mysocket.makefile()
htmldata=file.read()
file.close()
parser=htmllib.HTMLParser(formatter.NullFormatter()) 
parser.feed(htmldata)
print '\n'.join(parser.anchorlist)
parser.close()

相关文章

Python获取某一天是星期几的方法示例

Python获取某一天是星期几的方法示例

本文实例讲述了Python获取某一天是星期几的方法。分享给大家供大家参考,具体如下: 这里以2017年的春节(1月28号)为例: import re; import time; im...

在PyCharm下打包*.py程序成.exe的方法

如下所示: 1. 在PyCharm下安装pyinstaller 2. 在Terminal下输入:“pyinstaller -F -w *.py” 就可以制作出exe。生成的文件放在同目录...

Python将文本去空格并保存到txt文件中的实例

如下所示: #encoding=utf-8# x=raw_input("Please enter a text: ") y=x.replace(" ","") f = open(...

python 实现将文件或文件夹用相对路径打包为 tar.gz 文件的方法

默认情况下,tarfile 打包成的 tar.gz 文件会带绝对路径,而很多情况下,我们需要的是相对打包文件夹的路径。 代码: <pre name="code" class="...

Python 加密与解密小结

阅读目录 前言 加密算法分类 Python加密库 DES加密 AES加密 RSA加密 前言 据记载,公元前400年,古希腊人发明了置换密码。1881年世界上的第一个电话保密专利出现。在第...