phpsir 开发 一个检测百度关键字网站排名的python 程序

yipeiwu_com6年前Python基础
源码如下 :保存成utf-8 bd.py 文件
复制代码 代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
import urllib ,urllib2
import re
def baidu(w):
url= "http://www.baidu.com/s?"
values = {
"w":w.encode('gbk','ignore')
}
data = urllib.urlencode(values)
newurl = url + data
response = urllib2.urlopen(newurl)
the_page = response.read().decode('gbk','ignore')
return the_page

def ana(data,mysite):
o = re.compile("href=\"(.+?)\"")
f = o.findall(data)
line = 1
for ff in f:
if not re.search("baidu",ff) and not re.search("^s\?",ff) and re.search("^http:\/\/",ff):
if re.search(mysite,ff):
print "* " ,line ,ff
else:
print line ,ff
line += 1

if __name__ == "__main__":
mysite = sys.argv[2]
data = baidu(sys.argv[1].decode('utf-8'))
ana(data,mysite)

用法 python bd.py "关键字" 我的域名部分 :
例:
复制代码 代码如下:

python bd.py "vbs" "jb51.net"

相关文章

Python利用Django如何写restful api接口详解

Python利用Django如何写restful api接口详解

前言 用Python如何写一个接口呢,首先得要有数据,可以用我们在网站上爬的数据,在上一篇文章中写了如何用Python爬虫,有兴趣的可以看看:/post/141661.htm 大量的数...

在Python中利用Into包整洁地进行数据迁移的教程

在Python中利用Into包整洁地进行数据迁移的教程

动机 我们花费大量的时间将数据从普通的交换格式(比如CSV),迁移到像数组、数据库或者二进制存储等高效的计算格式。更糟糕的是,许多人没有将数据迁移到高效的格式,因为他们不知道怎么(或者不...

基于python的itchat库实现微信聊天机器人(推荐)

基于python的itchat库实现微信聊天机器人(推荐)

一、开始之前必须安装itchat库 pip install itchat(使用pip必须在电脑的环境变量中添加Python的路径) 或 conda install request 二、开...

Python imageio读取视频并进行编解码详解

读视频和写视频一直由于编解码的问题给程序员造成很多麻烦。对此进行了一些探索。用Python读取视频有两种主要方法,分别是基于imageio库和OpenCV,其中OpenCV加上ffmpe...

快速排序的算法思想及Python版快速排序的实现示例

快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。 1.分治法的基本思想...