phpsir 开发 一个检测百度关键字网站排名的python 程序

yipeiwu_com6年前Python基础
源码如下 :保存成utf-8 bd.py 文件
复制代码 代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
import urllib ,urllib2
import re
def baidu(w):
url= "http://www.baidu.com/s?"
values = {
"w":w.encode('gbk','ignore')
}
data = urllib.urlencode(values)
newurl = url + data
response = urllib2.urlopen(newurl)
the_page = response.read().decode('gbk','ignore')
return the_page

def ana(data,mysite):
o = re.compile("href=\"(.+?)\"")
f = o.findall(data)
line = 1
for ff in f:
if not re.search("baidu",ff) and not re.search("^s\?",ff) and re.search("^http:\/\/",ff):
if re.search(mysite,ff):
print "* " ,line ,ff
else:
print line ,ff
line += 1

if __name__ == "__main__":
mysite = sys.argv[2]
data = baidu(sys.argv[1].decode('utf-8'))
ana(data,mysite)

用法 python bd.py "关键字" 我的域名部分 :
例:
复制代码 代码如下:

python bd.py "vbs" "jb51.net"

相关文章

Django 权限认证(根据不同的用户,设置不同的显示和访问权限)

Django 权限认证(根据不同的用户,设置不同的显示和访问权限)

示意图: html:(模态框等 html和js代码,参考:Django 创建/删除用户) {# 权限管理 #} <div id="permissionManageDiv"...

详解Python中如何写控制台进度条的整理

详解Python中如何写控制台进度条的整理

本文实例讲述了Python显示进度条的方法,是Python程序设计中非常实用的技巧。分享给大家供大家参考。具体方法如下: 首先,进度条和一般的print区别在哪里呢? 答案就是print...

pandas数据筛选和csv操作的实现方法

1. 数据筛选 a b c 0 0 2 4 1 6 8 10 2 12 14 16 3 18 20 22 4 24 26 28 5 30 32 34 6 36 38 40 7 42...

详解Django中的权限和组以及消息

在认证框架中还有其他的一些功能。 我们会在接下来的几个部分中进一步地了解它们。 权限 权限可以很方便地标识用户和用户组可以执行的操作。 它们被Django的admin管理站点所使用,你也...

pygame游戏之旅 添加游戏界面按键图形

pygame游戏之旅 添加游戏界面按键图形

本文为大家分享了pygame游戏之旅的第10篇,供大家参考,具体内容如下 通过获取鼠标的位置然后进行高亮显示: mouse =pygame.mouse.get_pos() if 1...