python自动化实现登录获取图片验证码功能
主要记录一下:图片验证码
1.获取登录界面的图片
2.获取验证码位置
3.在登录页面截取验证码保存
4.调用百度api识别(目前准确率较高的识别图片api)
本次登录的系统页面,可以看到图片验证码的位置
from selenium import webdriver import time from PIL import Image base_url = '***********' browser = webdriver.Chrome() browser.maximize_window() browser.implicitly_wait(10) browser.get(base_url) # (1)登录页面截图 browser.save_screenshot("D:/pic.png")#可以修改保存地址 # (2)基操 browser.find_element_by_name("username").send_keys("gxx") browser.find_element_by_name("password").send_keys("123456") time.sleep(2) # (3)获取图片验证码坐标 code_ele = browser.find_element_by_xpath("//*[@id='app']/div/div[1]/form/div[3]/div/div/div[2]/div/img") print("验证码的坐标为:", code_element.location)#控制台查看{'x': 1086, 'y': 368} print("验证码的大小为:", code_element.size)# 图片大小{'height': 40, 'width': 110} # (4)图片4个点的坐标位置 left = code_ele.location['x']#x点的坐标 top = code_ele.location['y']#y点的坐标 right = code_ele.size['width']+left#上面右边点的坐标 down = code_ele.size['height']+top#下面右边点的坐标 image = Image.open('D:/pic.png') # (4)将图片验证码截取 code_image = image.crop((left, top, right, height)) code_image.save('D:/pic1.png')#截取的验证码图片保存为新的文件
上面我们已经把图片保存到本地
这就是我们截取的验证码
接下来要调用 百度ocr识别
然后可以选择通用文字识别或者 高精度版本,这个 看个人选择,不过验证码识别还是选择高精度 版本(也不一定识别的出来 大家还是佛吧,测试的时候让开发把验证码去掉嘻嘻)
自己去申请一个百度云账号,然后开通文字识别服务…就酱
新建一个py文件
#百度ocr提供了模板,我们直接复制就ok #下载通用文字识别的python sdk,一定要放在你写的代码的文件夹下面 from aip import AipOcr from os import path def baiduOCR(picfile,outfile):#picfile:图片文件名 outfile:输出文件 filename = path.basename(picfile)#图片名称 #百度提供 """ 你的 APPID AK SK """ APP_ID = ''#这是你产品服务的appid API_KEY = ''#这是你产品服务的appkey SECRET_KEY = ''#这是你产品服务的secretkey client = AipOcr(APP_ID, API_KEY, SECRET_KEY) i = open(picfile, 'rb') img = i.read() print("正在识别图片:\t" + filename) """ 调用通用文字识别(高精度版) """ message = client.basicAccurate(img) print("识别成功!") i.close() with open(outfile, 'a+') as fo:#这边是写进.txt文件 fo.writelines("*" * 60 + '\n')#搞点花里胡哨的做区分 fo.writelines("识别图片:\t" + filename + "\n" * 2) fo.writelines("文本内容:\n") # 输出文本内容 for text in message.get('words_result'):#识别的内容 fo.writelines(text.get('words') + '\n') fo.writelines('\n' * 2) print("文本导出成功!") print() if __name__ == '__main__' : outfile = 'D:/export1.txt'#保存的文件 baiduOCR('D:/pic1.png', outfile) print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)
这样就识别出来 了,这个能识别正确我也是惊讶了
毕竟之前好多次都 识别的不准确
好!这样 验证码就识别出来 惹,然后把识别的内容输进框子里,点击登录就ok
总结
以上所述是小编给大家介绍的python自动化实现登录获取图片验证码功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!