蓝盟IT外包,如何在Serverless中轻松识别验证码?

发布者:上海IT外包来源:http://www.lanmon.net点击数:1431

蓝盟IT小贴士,来喽!
前言
Serverless的概念自提出以来备受关注,特别是近年来Serverless发挥了前所未有的活力,各领域的工程师将Serverless架构与自己的工作相结合,通过Serverless架构进行了“
CAPTCHA是“completelyautomatedpublicturingtesttotellcomputersandhumansapart”(完全自动区分计算机和人类的图灵测试)的缩写,用户是计算机吗防止恶意密码的解读、投票、论坛灌水,有效地防止某个黑客对某个特定的注册用户以特定程序的暴力解读方式继续登录。 实际上captcha是现在很多网站通行的方式,以比较简单的方式实现了这个功能。 CAPTCHA的问题由计算机生成并评价,但这个问题只有人类才能解决,无法由计算机解决,因此回答问题的用户可以视为人类。 验证码是用于验证的代码,是用于验证人访问还是机器访问的“代码”。
那么,人工智能领域的验证码识别和Serverless架构会与什么样的火花碰撞呢? 本文通过Serverless架构和卷积神经网络(CNN  )算法,实现了验证码识别功能。
浅谈代码
代码的发展可以说非常迅速。 从第一个简单的数字验证码到后面的数字字符验证码,再到后面的数字字符中文验证码和图形图像验证码,简单的验证码素材正在增加。 从验证码的形式来看,输入、点击、拖动、消息验证码、语音验证码……
百度贴吧、乎、谷歌等相关网站的验证码各不相同,例如,选择正楷文字、选择指定物体的图像、依次点击图像中的文字等。
即使是文字认证码,也存在简单的数字验证码、简单的数字文字验证码、文字验证码、验证码中包含的计算、简单的验证码加上几个噪声成为复杂的验证码等很多不同。
授权码识别
1 .简单验证码识别
验证码识别是一个古老的研究领域,简单来说就是把图像上的文字转换成文本的过程。 近年来,随着大数据的发展,广大爬虫类工程师在对抗反爬战略时,对验证码的识别要求也在提高。 在简单验证码的时代,验证码的识别主要是通过对文本验证码进行图像的剪切来裁剪验证码的各部分2 .基于2.CNN的验证码识别
卷积神经网络(Convolutional  Neural  Network,CNN  )是前馈神经网络,人工神经元可以响应周围的单元进行大型的图像处理。 卷积神经网络包括卷积层和池塘化层。

如图所示,左图是现有的神经网络,其基本结构是输入层、隐含层、输出层。 右图是卷积神经网络,其结构由输入层、输出层、卷积层、池塘化层、全连接层构成。 卷积神经网络实际上是神经网络的展开,但实际上在结构上朴素的CNN和朴素的NN没有任何区别(当然,引入特殊结构的复杂的CNN与NN大不相同)。 对于传统的神经网络,CNN可以用实际效果大幅减少我们的网络参数数量,用较少的参数训练更好的模型,典型工作的一半的功率,而且可以有效地避免过拟合。 同样,通过filter的参数共享,即使在图像上进行了一定的平行移动操作的情况下,也可以认识到特征,这被称为“平行移动不变性”。 因此,模型变得更稳健。

文/上海蓝盟  IT外包专家

IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部