摘要:验证码全自动区分计算机和人类的公开图灵测试英语,简称,俗称验证码,是一种区分用户是计算机和人的公共全自动程序。百科介绍说的简单点就是随机生成的字符,输出在一张图片上这里不考虑其他形式的拖拽短信验证码等等。
一直想写这个,过了很久今天兴趣来了索性记录下。
验证码全自动区分计算机和人类的公开图灵测试(英语:Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA),俗称验证码,是一种区分用户是计算机和人的公共全自动程序。在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。
百科介绍
说的简单点就是随机生成的字符,输出在一张图片上[这里不考虑其他形式的拖拽/短信验证码等等]。
常见类型 思路本文只做演示使用,故取第一张图片验证码作为讲解示例。
图片上的每一点都有其RGB值,通过取色器可以获取到,肉眼观察可以看出该图验证码是纯数字纯色背景
通过取色器看出该验证码背景色RGB值为(212,214,204)
实现下面我们来用PHP的imagecolorsforindex函数取得图片所有点的RGB值:
$url = "http://210.32.33.91:8080/reader/captcha.php"; $im = imagecreatefromgif($url); imagegif($im, "1.gif"); $rgbArray = array(); $res = $im; $size = getimagesize($url); $wid = $size["0"]; $hid = $size["1"]; for ($i = 0; $i < $hid; ++ $i) { for ($j = 0; $j < $wid; ++ $j) { $rgb = imagecolorat($res, $j, $i); $rgbArray[$i][$j] = imagecolorsforindex($res, $rgb); } }
结果如下:
各位可能想问这有什么用呢? 下面我们换一种方式来显示数据,为背景色输出□,验证码区域输出■,再来看下:
for ($i = 0; $i < $hid; $i ++) { for ($j = 0; $j < $wid; $j ++) { if ($rgbArray[$i][$j]["red"] == 212) { echo "□"; } else { echo "■"; } } echo "
"; }
效果:
这样一下是不是很清楚了。
但是你可能还是有疑问,尽管可以看出来了,但是如何知道是多少呢?
下面我们来分析下:
每个验证码直接间距4格,左右间距6/10格,上下间距16/10格。
我们再来去掉这些干扰点,可以看得更清晰些:
是不是很清晰了?可能还是有人会问,你讲这么多到底要怎么才能知道图片上的数字是多少.
好吧,说下我的思路,我们将刚刚的□和■换为0和1,而这些数字形状是固定的,这样就可以得到0-9每一个字的每一个区域8*10都有0和1组成了,
我们再来进行每8个切分,去掉4格间距,循环得出0-9的01组合值:
$dic = array( "00011000001111000110011011000011110000111100001111000011011001100011110000011000" => 0, "00011000001110000111100000011000000110000001100000011000000110000001100001111110" => 1, "00111100011001101100001100000011000001100000110000011000001100000110000011111111" => 2, "01111100110001100000001100000110000111000000011000000011000000111100011001111100" => 3, "00000110000011100001111000110110011001101100011011111111000001100000011000000110" => 4, "11111110110000001100000011011100111001100000001100000011110000110110011000111100" => 5, "00111100011001101100001011000000110111001110011011000011110000110110011000111100" => 6, "11111111000000110000001100000110000011000001100000110000011000001100000011000000" => 7, "00111100011001101100001101100110001111000110011011000011110000110110011000111100" => 8, "00111100011001101100001111000011011001110011101100000011010000110110011000111100" => 9 );
得出这10个后组合成数组,每次解析图片RGB换成对应数组值就得到验证码值了。下面来演示下:
最后为了准确性,取100个循环看看:
哈哈,准确率100%
写在最后本文的目的是为了让WEB开发者在生成验证码时注意安全,请勿用于非法目的.
本项目所演示的站点(杭州电子科技大学图书馆->我的图书馆)无法打开,各位参考原理即可
代码已在github:https://github.com/chaclee/sf
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/30283.html
小编写这篇文章的主要目的,主要是给大家去做一个相关的介绍,介绍的内容是关于Python通用验证码的一些相关小技巧,包括有通用验证码识别相关的OCR库,同时也会给大家介绍一些内容,介绍包括OCR库ddddocr安装使用教程,下面小编就给大家详细解答下。 前言 在使用自动化登录网站的时候,经常输入用户名和密码后会遇到验证码。今天介绍一款通用验证码识别OCR库,对验证码识别彻底说拜拜,它的名字是...
摘要:模拟登录新浪微博的核心,也是与模拟登录最大的不同,密码加密。已经实现模拟新浪微博登录的功能,之后不再更新。 参考资料: http://www.csuldw.com/2016/11/10/2016-11-10-simulate-sina-login/ http://blog.csdn.net/fly_leopard/article/details/51148904 http://www....
摘要:成果展示总结这个脚本就是简单的利用的库,来模拟用户注册的流程,以达到邀请用户的目的。这个脚本也有很多不完善的地方,比如验证码识别机器人检测一些错误判断都没有,待完善的地方还有很多。这个脚本只是为了和大家交流学习。 区块鱼是一个基于区块链的游戏,这个游戏目前有个邀请活动,邀请好友注册,送相应种类的鱼,不同的鱼价格不一样 普通鱼 0.015 ETH起(邀请3个好友) 稀缺鱼 0.05...
阅读 1386·2021-10-08 10:04
阅读 2710·2021-09-22 15:23
阅读 2733·2021-09-04 16:40
阅读 1185·2019-08-29 17:29
阅读 1504·2019-08-29 17:28
阅读 3001·2019-08-29 14:02
阅读 2230·2019-08-29 13:18
阅读 856·2019-08-23 18:35