phpsir 开发一个检测百度关键字网站排名的python 程序

yipeiwu_com6年前 (2020-03-06)Python基础

源码如下：保存成utf-8 bd.py 文件

复制代码代码如下:

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 
import sys 
import urllib ,urllib2 
import re 
def baidu(w): 
url= "http://www.baidu.com/s?" 
values = { 
"w":w.encode('gbk','ignore') 
} 
data = urllib.urlencode(values) 
newurl = url + data 
response = urllib2.urlopen(newurl) 
the_page = response.read().decode('gbk','ignore') 
return the_page 

def ana(data,mysite): 
o = re.compile("href=\"(.+?)\"") 
f = o.findall(data) 
line = 1 
for ff in f: 
if not re.search("baidu",ff) and not re.search("^s\?",ff) and re.search("^http:\/\/",ff): 
if re.search(mysite,ff): 
print "* " ,line ,ff 
else: 
print line ,ff 
line += 1 

if __name__ == "__main__": 
mysite = sys.argv[2] 
data = baidu(sys.argv[1].decode('utf-8')) 
ana(data,mysite) 

用法 python bd.py "关键字" 我的域名部分 :
例:

复制代码代码如下:

python bd.py "vbs" "jb51.net"

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

相关文章

简单学习Python多进程Multiprocessing

简单学习Python多进程Multiprocessing

1.1 什么是 Multiprocessing 多线程在同一时间只能处理一个任务。可把任务平均分配给每个核，而每个核具有自己的运算空间。 1.2 添加进程 Process 与线程类似，...

python3.5仿微软计算器程序

本文实例为大家分享了python3.5仿微软计算器的具体代码，供大家参考，具体内容如下 from tkinter import * from math import * root =...

python自动化测试之如何解析excel文件

前言自动化测试中我们存放数据无非是使用文件或者数据库，那么文件可以是csv，xlsx，xml，甚至是txt文件，通常excel文件往往是我们的首选，无论是编写测试用例还是存放测试数据，...

django-rest-framework解析请求参数过程详解

django-rest-framework解析请求参数过程详解

前言我们在django-rest-framework 自定义swagger 文章中编写了接口, 调通了接口文档. 接口文档可以直接填写参数进行请求, 接下来的问题是如何接受参数, 由...

对python字典过滤条件的实例详解

如下所示： d = { 'a': '0.0000', 'b': '1.2' } d_tmp = dict((key, value) for key, value in d...