人工智能涉罪细节首次披露!你的个人信息就这样被破解了

摘要:这一黑产链条中,参与到数据泄露环节的人工智能技术颇为关键,使得非法获取个人信息的成本大幅降低。

本文来自微信公众号“财经”(ID:mycaijing)

记者:刘甦 

编辑:李恩树

人类围棋界“最强大脑”败于人工智能Alphago时,另一人工智能已经进入违法犯罪的黑色领域。

一起普通的网络代付诈骗,牵出一个利用人工智能技术、一秒钟盗取2000组公民信息数据的犯罪团伙。通过深挖公民个人信息账号密码买卖这条线索,浙江绍兴警方发现一条涉及利用黑客技术非法获取网站后台用户注册数据、数据撞库、绕开互联网公司安全策略的打码平台、网络诈骗、非法信息推广的互联网黑色产业链。

这一黑产链条中,参与到数据泄露环节的人工智能技术颇为关键,使得非法获取个人信息的成本大幅降低。

量贩个人信息

2017年2月9日晚,绍兴市公安局越城区分局城南派出所接到公民虞玉华报案称,虞当晚收到好友王甜的一条信息,王甜购买一件价值1922元的商品,因手机支付不成功,请虞帮忙代付。虞玉华通过手机为好友支付货款后,对方再次要求付款,她疑心被骗因而报案。结果证明,王甜的账号被盗,有人冒充王甜对其好友实施诈骗。

接到虞玉华报警后,越城警方在哈尔滨抓获这个利用社交软件冒充好友实施代付诈骗的犯罪团伙。团伙成员十余人,均为同学关系。

他们在哈尔滨一个居民小区里租了一套两居室,客厅被改造成工作室,码放8台电脑作为作案工具,吃住、诈骗都在这套出租屋内进行。团伙分工明确,头目郑前负责招募人员、培训和购买作案工具,其他成员登录不同种类的社交软件实施诈骗。

在这个团伙的电脑中,绍兴警方发现大量公民个人信息。“信息最多的一台电脑中有300多GB的个人信息,包括多个邮箱、社交软件的账号和密码,而且都很准确。”越城区公安分局网警大队大队长钱立锋向《财经》记者介绍。

这些信息从何而来?郑前称,这些信息是他以一组2元左右的价格,共花40多万元从吴杰等人手中买来的。而吴杰手中的信息则来自一个黑客犯罪团伙,该团伙利用超级SQL注入工具、网站漏洞扫描软件,批量扫描网站程序漏洞,非法获取网站后台用户注册数据,这被称为“脱库”。

这些数据大多是邮箱账号和密码。获取网站后台数据后,黑客团伙将包含各类邮箱和密码的数据分门别类进行销售,以每10万条数据50元到100元的价格卖给吴杰等人。

获取数据后,吴杰等人用“撞库”软件进行批量撞库、匹配,进而将各类账号与密码匹配成功的账户以1.2元到2元一个的价格,贩卖给网络诈骗犯罪团伙。

“撞库”是黑客通过收集互联网已泄露的用户账户和密码信息,生成对应的字典表,尝试批量登录其他网站后,得到一系列可以登录的账号。

“脱库”窃取到的邮箱、社交软件等账号密码信息大多是单一的、无效的,需要将这些信息进行“清洗”。

钱立锋告诉《财经》记者,很多用户习惯在不同网站使用相同的邮箱账号登录,甚至登录账号密码也和邮箱一样。黑客可以通过获取用户在A网站的账户从而尝试登录B网址,这就完成一次“撞库”尝试。

经过“撞库”清洗后,一些账号关联的其他平台账号被顺利登录,完成“清洗”后的数据更为丰富,可以精准获知该用户的许多平台注册信息,这在犯罪分子眼中极有价值,价格也随之涨高。

去年山东女大学生徐玉玉被诈骗分子以发放助学金的名义,骗走全部学费9900元,在报警回家的路上猝死,就是由于骗子掌握了徐玉玉准确的录取信息、手机号码等个人信息,精准实施诈骗。

“码奴”产业

为了防止黑客批量测试账户密码,各网站和平台动了不少脑筋,“验证码”是常用防范手段之一。

网络用户在各大网站或者平台注册、登录账号时,经常可以见到包括字符式、数字、字符+点选式、滑块拼图式、图片人工答题式等验证码,其中字符型验证码形式是互联网行业普遍采用的验证码形式。

验证码的防范机制是:提出的问题要容易被人类解答,而让机器无法解答。

当账号登录存在异常的时候,为了保护账号安全,系统会提示输入验证码。其目的是防止黑产人员批量恶意登录——他们可以利用机器大量输入账号和密码,但是机器无法识别验证码。由此,对于想要获取精准个人账户信息的犯罪团伙,在“撞库”环节中,如何进行批量验证就成为关键。

由于无法规避验证码,黑客们若要试出有效密码,需要人工逐条输入信息和识别验证码,比对、验证并成功匹配个人信息的账号密码,确认信息准确可以使用,再交给数据商——这些人在圈内被称为“码奴”,这一环节也被称为“打码”。

一位“码奴”向《财经》记者透露,根据验证码的复杂程度和输入的准确率,打1000个验证码会挣取1元至25元不等,每天工作12小时,最多可以输入2万个验证码,挣到300多元。

最熟练的“码奴”输入一个验证码也需要一秒钟时间。在传统的信息泄露相关犯罪中,因高昂的人力资本和较为漫长的工作周期,被“清洗”的数据相对有限。

因此在查获巨量个人信息后,越城警方意识到,这一系列案件中的“打码”绝非人工识别完成。随后警方调查发现,该案中,拿到原始数据的数据商,通过一个名为“快啊”的打码平台进一步进行深加工。

工商信息显示,“快啊”平台是沈阳纳信科技有限公司旗下产品,该公司经营范围为计算机科学技术研究、计算机软件开发、网络技术研究、网络工程设计、计算机软件销售等。警方在调查中发现,该平台专为网络黑产和灰产识别破解字符型验证码提供技术帮助。

打码平台上有多种针对不同互联网产品进行“撞库”的软件,数据商将验证码传给“快啊”打码平台的某一“撞库”软件识别接口,打码平台将验证码发给后端的“码奴”进行识别,并获取识别结果。

越城警方对“快啊”平台数据分析获知,接入该平台提供验证码识别服务的“撞库”软件有100多款,接入平台的用户达1.1万余人,从2016年6月到2017年3月,平台资金进账累计达1650万元,为国内最大的“打码”平台。

钱立锋介绍说,“打码”平台目前游走在法律边缘,界定并不清晰。“什么样的人需要批量识别验证码?往往都是从事网络黑产和灰产的人员。”


(犯罪嫌疑人使用的部分作案工具)

除黑色产业的诈骗人员,打码平台的通常使用者是“羊毛党”、抢票的“黄牛”及论坛刷帖“水军”。

以“羊毛党”为例,一些网贷平台为吸引投资者常推出一些收益丰厚的活动,如注册认证奖励、充值返现、投标返利等,催生了以此寄生的投机群体“羊毛党”。“羊毛党”去某网站刷活动优惠券,但该网站有较复杂的验证码,通常“羊毛党”会在打码平台注册账号并充值,并通过打码平台提供的接口,提交验证码识别。打码平台将验证码分发到各个“码奴”客户端里,获取识别结果,并最终反馈给“羊毛党”。

据办案民警介绍,“快啊”平台被查的前三个月,已提供验证码识别服务259亿次。


(犯罪嫌疑人与赃款)

在人力资源有限的情况下,“快啊”平台如何做到可以提供巨量的验证码识别服务?越城警方在其背后发现一个无需“码奴”的高级“打码”技术。

AI“打码”

随着侦查深入,越城警方发现,为“快啊”平台提供验证码识别服务的一个重要软件系统名为NID,这一人工智能程序由厦门人杨柯设计。

杨柯现年33岁,家境优越,父亲是当地房地产开发商,他和妻儿住在厦门一处140多平方米的住宅里,每平方米售价近5万元。

毕业于厦门某大学计算机专业的杨柯研究人工智能已有十余年。杨柯称,他使用伯克利大学开发的caffe框架作为深度学习框架,并且使用VGG16结构创建了一个神经网络,之后从网络上下载了几乎全世界所有字体,对神经网络进行训练,使它具有图文转换的能力,再将这个神经网络与具有图像接受和处理结果返回功能的服务端进行网络连接,构成一个系统,命名为NID。

每天,像教儿童一样,杨柯要培训NID学习识别各种验证码。在他的“培养”下,NID破解验证码的能力越来越强。


(杨柯制作的验证码样本库。)

钱立锋告诉《财经》记者,通过运用人工智能机器深度学习技术训练机器,杨柯让NID如AlphaGo一样自主操作识别,有效识别图片验证码,轻松绕过互联网公司设置的账户登录安全策略——验证码。

由于人工智能的帮助,NID“打码”速度很快,平均一秒可以识别出2000个验证码,是人工“打码”的2000倍;且正确率很高,可以识别出98%以上的验证码。

杨柯称,NID程序刚编写完成,正确率就高达95%,基本能正确识别所有清晰图片中的文本,杨柯还不断充实样本库,给NID程序输入大量的图片文件让其进行识别,NID程序本身就具备很高的识别应对能力;此外,NID系统也会自动学习,它每秒钟会从用户反馈的识别错误样本库中抽取一张比对正确答案进行学习,这个学习过程从编写出程序到案发前,时刻进行。

验证码被NID系统识别出后,黑客窃取的半成品信息,相当于完成了深加工。数据商拿到这些精准信息,打包组合,出售给个人信息产业链下游的诈骗集团、广告商,一条精准的个人信息,甚至可以卖到几百元。

“快啊”打码平台收取信息处理费用,收入的50%给了撞库软件作者,50%由平台开发商李奇和杨柯平分。短短一年内,平台牟利1300多万元,杨柯分得300多万元。利用NID程序,多的时候,杨柯一个月可以挣六七十万元。

2017年3月23日,“快啊”平台涉案被越城警方侦查。由于该案犯罪手法新颖、社会危害大,越城公安分局成立由网警牵头,刑侦、特警、派出所等多部门配合组成的专案组。

围绕该产业链的上下游,专案组辗转福建、广东、江西、黑龙江、辽宁、山东等13个省展开侦查、抓捕,抓获利用黑客技术非法获取网站后台数据的嫌疑人4人,使用撞库软件获取账户密码的嫌疑人19人,提供图片验证服务的“快啊”打码平台嫌疑人2人,制作“撞库”软件的9人,利用公民个人信息实施网络犯罪的团伙28个,共159人。

防范难题

一位数据安全专家介绍,“快啊”打码平台利用NID程序对字符型验证码的破解,是基于人工智能的深度学习框架,使用相关的网络模型训练学习,来实现对字符型验证码的海量快速识别破解。由于字符型验证码是互联网通用的安全策略,一旦被破解攻陷,将会给包括政企网站在内的互联网行业用户数据安全带来风险。

基于深度学习原理,只要样本库足够丰富,这一智能程序可以识别的东西会越来越多——即使复杂如铁路订票平台12306的验证码,也只是物品种类多、形态多样的图片识别,假以时日,NID程序一样可以破解。

腾讯安全专家周正认为,互联网行业的安全防范主要是对抗有规律、有特点的恶意行为,对抗这种有深度学习能力的人工智能犯罪,有必要提升防范等级,增加多维度的安全验证环节。

比如,登录时使用字符型验证码,二次登录用短信或邮件验证,辅助以滑块解锁等方式,“对抗不断升级的入侵攻击,提高犯罪门槛,强化动态机制,是互联网安全行业一直在做的事情”。

人工智能(Artificial Intelligence),英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

随着科技发展,近几年,“人工智能”这一概念通常指的是谷歌等公司开源的一些基于神经网络进行深度学习、可以不断训练强化神经网络的人工智能。杨柯开发的NID程序即属于这一人工智能范畴。

基于“深度学习”的新型人工智能,极大降低了网络黑产犯罪成本。如NID程序对字符型验证码的识别破解已快到毫秒级,“打码”平台的效率和业务量借此呈指数级别增长。而作为“验证”这一重要的网络安全环节,被攻陷后可被不法分子用于多个不同场景作恶,如撞库、窃取信息、恶意灌水发帖、刷单、刷点击量等,危害互联网生态。

钱立锋感慨,以往的黑客攻击针对网站漏洞入侵,相当于“开锁式进入”,而借助于人工智能,进攻方式变成了“硬闯”。

值得关注的是,这一案例是否意味着人工智能犯罪时代已经到来?

北京交通大学计算机与信息技术学院副教授王伟介绍,目前人类已经掌握了“弱人工智能”,即能制造出真正推理和解决问题的智能机器,这些机器并不真正拥有智能,也不会有自主意识,同在各方面能和人类比肩的“强人工智能”和比人类大脑聪明许多的“超人工智能”相比,“弱人工智能”只是人工智能的初级阶段,NID系统属于此列。

基于此,上海财经大学法学院副院长胡凌认为,上述案件中,“人工智能”只是辅助犯罪嫌疑人实施犯罪的工具和手段,犯罪主体仍然是人而非机器,尚在中国刑法规制范围内。

不过,钱立锋认为,在打击互联网技术类犯罪面前,《刑法》在适用上还有很多待商榷之处,譬如如何理解主观明知、证据标准如何把握、宣告刑普遍偏轻等问题,在适用上应统一认识。

另外,电信诈骗等犯罪的办案主体往往是县一级公安机关。虽然电信诈骗办案难度不大,但为打掉整个黑色产业链,需要办案人员向上追溯到信息泄露、“打码”等技术环节。但实际中,证据固定难度通常很大——数据会被犯罪分子删除,数据经网络流转后,调取比较困难,县级公安的技术能力往往有限。

钱立锋以上述案件举例,该案技术门槛高,复杂程度也很大,办案机关扣留涉案设备后需要将“撞库”软件、“打码”平台程序、神经网络图片验证码识别程序三个不同功能的软件重新搭建,模拟现实环境,全程录像取证,协同作业后,才能认定为一个能完整实现破解识别字符型验证码、“撞库”、“洗库”的软件系统。

今年10月16日,在最高检察院召开的新闻发布会上,最高检公诉厅副厅长张相军表达了类似观点。他指出,与传统的刑事犯罪相比,网络犯罪具有主体的智能性、行为的隐蔽性、手段的多样性、传播的广域性等突出特点。

与这些特点紧密相连,检察机关惩治计算机网络犯罪方面遇到的难点主要有取证和证明难——网络空间所有行为通过数字化的形式完成,没有目击证人,网络犯罪证据多以电子数据为主要形态,侦查取证主要依赖技术手段完成;此外,网络犯罪的取证、鉴定、定性等都需要很强的专业知识,检察机关办理此类案件需要大量专业人才。但从目前的实际情况看,检察机关网络技术人才十分缺乏,既精通法律业务又熟悉网络技术的复合型检察人才更是匮乏。

周正对未来表示担忧。他认为,上述案件虽然仅是个案,有一定的技术门槛。但可以看出,网络黑产犯罪分子对技术应用到如此程度,已极尽所能。“人工智能本身是一种技术,但随着高速发展,已成为双刃剑,如何用好这项技术,值得更加深入地研究和实践。”

整体而言,技术犯罪数量在不断上升。最高检新闻发言人王松苗在前述新闻发布会上表示,2016年以来,全国因涉嫌计算机犯罪被检方提起公诉的共1568人,仅今年1月至9月就有710人,同比上升80.7%。41169人因涉嫌网络电信侵财犯罪被公诉,今年前九个月就有22268人,同比上升118.6%。

最高检会同最高法正在共同研究起草《关于办理网络犯罪案件适用法律若干问题的解释》,将针对《刑法修正案(九)》增设的拒不履行信息网络安全管理义务罪、非法利用信息网络罪、帮助信息网络犯罪活动罪,明确定罪量刑标准和有关法律适用问题。

本文为 品途商业评论(http://www.pintu360.com)转载作品,作者: 刘甦 ,责编:柴佳音。转载()请联系原作者。本文仅代表作者观点,不代表品途商业评论观点。

发表评论

您的操作太快喽,请输入验证码

您输入的验证码不正确。

看不清? 点击更换
确定