利用Python检测URL状态

yipeiwu_com6年前Python基础

需求:Python检测URL状态,并追加保存200的URL

代码一:

#! /usr/bin/env python
#coding=utf-8
import sys
import requests
def getHttpStatusCode(url):
  try:
    request = requests.get(url)
    httpStatusCode = request.status_code
    return httpStatusCode
  except requests.exceptions.HTTPError as e:
    return e
 
if __name__ == "__main__":
  with open('1.txt', 'r') as f:
    for line in f:
      try:
        status = getHttpStatusCode(line.strip('\n'))#换行符
        if status == 200:
          with open('200.txt','a') as f:
            f.write(line + '\n')
            print line
        else:
          print 'no 200 code'
      except Exception as e:
        print e

代码二:

#! /usr/bin/env python
# -*--coding:utf-8*-

import requests

def request_status(line):
  conn = requests.get(line)
  if conn.status_code == 200:
    with open('url_200.txt', 'a') as f:
      f.write(line + '\n')
    return line13   else:
    return None


if __name__ == '__main__':
  with open('/1.txt', 'rb') as f:
    for line in f:
      try:
        purge_url = request_status(line.strip('\n'))
      except Exception as e:
        pass

代码三:

#! /usr/bin/env python
#coding:utf-8
import os,urllib,linecache
import sys
result = list()

for x in linecache.updatecache(r'1.txt'):
  try:
    a = urllib.urlopen(x.replace('/n','')).getcode()
    #print x,a
  except Exception,e:
    print e
  if a == 200:
    #result.append(x)               #保存
    #result.sort()                    #排序结果
    #open('2.txt', 'w').write('%s' % '\n'.join(result)) #保存入结果文件
    with open ('200urllib.txt','a') as f: ## r只读,w可写,a追加
      f.write(x + '\n')
  else:
    print 'error'

总结

以上所述是小编给大家介绍的python 检测url 状态,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

Python参数解析模块sys、getopt、argparse使用与对比分析

Python参数解析模块sys、getopt、argparse使用与对比分析

一些命令行工具的使用能够大大简化代码脚本的维护成本,提升复用性,今天主要是借助于python提供的几种主流的参数解析工具来实现简单的功能,主要是学习实践为主,这是新年伊始开工的第一篇,还...

python 简单搭建阻塞式单进程,多进程,多线程服务的实例

我们可以通过这样子的方式去理解apache的工作原理 1 单进程TCP服务(堵塞式) 这是最原始的服务,也就是说只能处理个客户端的连接,等当前客户端关闭后,才能处理下个客户端,是属于阻塞...

python分块读取大数据,避免内存不足的方法

如下所示: def read_data(file_name): ''' file_name:文件地址 ''' inputfile = open(file_name, 'rb'...

python+django加载静态网页模板解析

python+django加载静态网页模板解析

接着前面Django入门使用示例 今天我们来看看Django是如何加载静态html的? 我们首先来看一看什么是静态HTML,什么是动态的HTML?二者有什么区别? 静态HTML指的是使用...

浅谈Python中的数据类型

数据类型: float — 浮点数可以精确到小数点后面15位 int — 整型可以无限大 bool — 非零为true,零为false list — 列表 Float/Int: 运...