为什么验证码变得如此困难
证明你不是机器人越来越难了
去年的某个时候,谷歌的不断要求,以证明我的人开始感到越来越咄咄逼人越来越多的,简单的,有点太可爱的按钮说我不是机器人,然后要求证明这一点——通过选择图像网格中的所有交通信号灯,人行横道和店面很快,红绿灯就被远处的树叶掩埋了,人行横道弯曲了一半,转了个弯,店面的标牌模糊不清,而且是韩文被要求识别消防栓并在其中挣扎是一件特别令人沮丧的事情
这些测试被称为 CAPTCHA,是完全自动化公共图灵测试的首字母缩写,用于区分计算机和人类,并且它们之前已经达到了这种难以理解的高值在 2000 年代初期,简单的文本图像足以阻止大多数垃圾邮件机器人但十年后,在谷歌从卡内基梅隆大学的研究人员那里购买了该程序并用它来数字化谷歌图书之后,文本不得不越来越扭曲和模糊,以保持领先于改进光学字符识别程序——这些程序以一种迂回的方式,所有解决验证码的人都在帮助改进
所有那些可能是也可能不是店面的遮阳篷它们是人类与机器进行军备竞赛的最后阶段
因为 CAPTCHA 是一种非常优雅的人工智能训练工具,所以任何给定的测试都只能是暂时的,它的发明者一开始就承认这一点伴随着所有这些研究人员,骗子和普通人在人工智能可以做的门槛上解决数十亿个谜题,在某些时候机器会从我们身边经过在2014年,谷歌进站它的机器学习算法,一个针对解决最扭曲的文本人类验证码:电脑拿到了测试正确的时间99.8%,而人类得到了区区33%
谷歌随后转移到NoCaptcha ReCaptcha,它观察用户数据和行为,让一些人通过点击我不是机器人按钮通过,并向其他人展示我们今天看到的图像标签但机器再次迎头赶上所有那些可能是也可能不是店面的遮阳篷它们是人类与机器进行军备竞赛的最后阶段
伊利诺伊大学芝加哥分校计算机科学教授 Jason Polakis 将最近 CAPTCHA 难度的增加归功于个人2016 年,他发表了一篇论文,其中他使用现成的图像识别工具,包括谷歌自己的反向图像搜索,以 70% 的准确率解决谷歌的图像验证码其他研究人员使用谷歌自己的音频识别程序破解了谷歌的音频验证码挑战
Polakis 说,机器学习现在在基本的文本,图像和语音识别任务上与人类差不多事实上,算法可能更擅长于此:我们正处于让软件变得更难最终让许多人变得太难的地步我们需要一些替代方案,但还没有具体的计划
许多这些测试的问题并不一定是机器人太聪明了——而是人类很讨厌它们
关于 CAPTCHA 的文献中充斥着错误的开端和奇怪的尝试,试图找到人类普遍擅长但机器难以应对的文本或图像识别以外的东西研究人员尝试要求用户按面部表情,性别和种族对人的图像进行分类已经有关于琐事验证码和基于童谣的验证码的提议在据称用户长大的地区很常见这种文化验证码不仅针对机器人,还针对在海外验证码农场工作的人类,他们只需几分钱就能解决难题人们试图通过要求用户识别猪来阻碍图像识别,但将猪制作成卡通片并给它们戴太阳镜研究人员已经研究过要求用户识别魔眼状斑点中的物体在一个有趣的变化中,研究人员在 2010 年提出使用 CAPTCHA 来索引古代岩画,计算机并不擅长破译在洞穴墙壁上潦草的驯鹿手势草图
最近有人努力开发类似游戏的验证码,测试要求用户将对象旋转到特定角度或将拼图块移动到适当的位置,指令不是以文本形式而是以符号形式给出,或者由游戏板的上下文暗示希望人类能够理解谜题的逻辑,但缺乏明确指令的计算机会被难住其他研究人员试图利用人类有身体的事实,使用设备摄像头或增强现实来交互证明人性
许多这些测试的问题并不一定是机器人太聪明了——而是人类很讨厌它们并不是说人类是愚蠢的,人类在语言,文化和经验上的差异很大
做人是什么。
这些测试受到人类能力的限制,Polakis 说这不仅是我们的身体能力,还需要 跨文化,跨语言的东西您需要某种类型的挑战,同时与来自希腊,芝加哥,南非,伊朗和澳大利亚的人一起工作它必须独立于文化的复杂性和差异你需要一些对普通人来说很容易的东西,它不应该被束缚在特定的人群中,同时对计算机来说应该很困难这对您实际可以做的事情非常有限它必须是人类可以快速完成且不会太烦人的事情
弄清楚如何快速解决这些模糊的图像测验会将您带入哲学领域:可以向机器展示但没有机器可以模仿的普遍人类品质是什么做人是什么
但也许我们的人性不是通过我们如何完成一项任务来衡量的,而是通过我们如何穿越世界——或者在这种情况下,通过互联网来衡量Shuman Ghosemajumder 表示,游戏验证码,视频验证码以及你设计的任何类型的验证码测试最终都会被破解,他曾在谷歌工作,打击点击欺诈,后来成为机器人检测公司 Shape Security 的首席技术官与测试相比,他更喜欢所谓的持续身份验证,本质上是观察用户的行为并寻找自动化的迹象一个真正的人类不能很好地控制自己的运动功能,因此即使他们非常努力地尝试,他们也不能在多次交互中多次以相同的方式移动鼠标,Ghosemajumder 说
谷歌自己的验证码团队也在考虑类似的思路最新版本,reCaptcha v3去年年底宣布,使用自适应风险分析根据可疑程度对流量进行评分,然后,网站所有者可以选择向粗略的用户提出挑战,例如密码请求或双重身份验证根据 CAPTCHA 团队的产品经理 Cy Khormaee 的说法,谷歌不会说影响该分数的因素,只是谷歌会观察网站上的一堆良好流量,并使用它来检测交通不便 安全研究人员表示,这可能是 cookie,浏览器属性,流量模式和其他因素的混合新的机器人检测模型的一个缺点是,它可以使浏览网页的同时最大限度地减少监控是一种恼人的体验,因为 VPN 和反跟踪扩展等东西可能会让你被标记为可疑和挑战
我认为人们正在意识到有一个应用程序可以模拟普通人类用户......或愚蠢的人类。据了解,手机短信的主要服务之一就是接收验证码。正常情况下,相关软件会将此类营销短信识别为“验证码”短信,不会拦截。这被一些无良商家利用。。
谷歌 CAPTCHA 团队的工程负责人 Aaron Malenfant 表示,放弃图灵测试是为了回避人类不断输掉的竞争伴随着人们对机器学习的投资越来越多,这些挑战对人类来说将变得越来越难,这尤其是我们推出 CAPTCHA V3 以领先于这条曲线的原因 Malenfant 说,从现在起的五到十年内,验证码挑战可能根本不可行相反,大部分网络都将在后台运行一个持续的,秘密的图灵测试
在他的《最人性化的人》一书中,布莱恩·克里斯蒂安作为人类陪衬参加了图灵测试竞赛,并发现实际上很难在对话中证明自己的人性另一方面,机器人制造商发现它很容易通过,不是通过成为最有说服力或最聪明的对话者,而是通过不合逻辑的笑话回避问题,制造错别字,或者在 2014 年赢得图灵竞赛的机器人的情况下,自称是一个英语不好的13岁乌克兰男孩毕竟,犯错是人之常情验证码可能会迎来类似的未来——一场新的军备竞赛,不是要创建在标记图像和解析文本方面超越人类的机器人,而是会犯错误,错过按钮,分心的机器人,并切换选项卡我认为人们正在意识到有一个应用程序可以模拟普通人类用户......或愚蠢的人类,Ghosemajumder 说
验证码测试也可能在这个世界上持续存在亚马逊在 2017 年获得了一项专利,该专利涉及视觉错觉和人类难以破译的逻辑谜题通过失败称为图灵测试,通过的唯一方法是得到错误的答案
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。