- A+
该算法已在数十个网站上进行了测试
信息安全专家开发了一种机器学习算法,能够以比以往开发的方法更简单,更准确的方式打破基于文本的CAPTCHA控制,正如国际网络安全研究所的网络安全专家所报告的那样。
这个由英国和中国的专家团队开发的新算法基于生成对抗网络 (GAN)的实现,这是一种特殊的人工智能算法,在算法无法访问大量数据的情况下非常有用。用于学习的数据。
根据网络安全专家的说法,分类机器学习算法通常需要数百万个数据点才能进行训练,然后才能执行具有所需精度的任务。
另一方面,GAN算法的优点是能够使用更少量的数据来开始学习,这要归功于GAN使用“生成”补码来产生类似的数据。 然后将生成的数据点馈送到试图猜测输出的“求解器”算法。
开发此算法的专家应用相同的概念来破解CAPTCHA文本,该文本仅使用需要大量初始数据点的机器学习算法进行测试。
研究人员提到,在真实环境中,攻击者无法在未被网站检测或禁止的情况下实时生成数百万个CAPTCHA。 因此,根据亚马逊的Alexa,在调查的50个访问量最大的网站中,只有500个基于文本的CAPTCHA被使用。
用于训练算法的数据列表包括来自维基百科,微软,EBay和谷歌等网站的文本CAPTCHA。
在编译和训练“求解器”以生成200k“人工”CAPTCHA之后,网络安全专家针对网络中使用的多文本CAPTCHA系统测试了他们的算法,该系统之前也测试过其他算法。
研究人员表示,在Megaupload,Blizzard或Authorize.NET等网站上测试时,他们的方法能够100%准确地解决文本CAPTCHA。 专家补充说,该方法在亚马逊,PayPal,雅虎或Slashdot等网站中也被证明是高度准确的。
除了提高准确性之外,研究人员还报告说,他们开发的GAN算法的求解器组件也比克服CAPTCHA的任何其他方法更有效,更便宜。 “该算法可以使用台式PC在0.05秒内解决CAPTCHA,”研究人员表示。