阿里云:ET城市大脑计算性能已进化20倍,正研发测试全新AI芯片

摘要:城市大脑将会成为整个城市的基础设施,基础设施之上开放了广阔的空间留给开发者。

品途商业评论讯 近日,阿里巴巴达摩院机器智能实验室副主任华先胜在中国人工智能安防峰会宣布,阿里云ET城市大脑性能相比最初版本,已有20倍的提升。

华先胜称,各地在建设城市大脑时首先想到的问题是,将整个城市的数据,尤其是视频数据全部进行传输计算、实时分析,城市大脑能否吃的消。“依靠阿里云实时计算平台,ET城市大脑要吃下这些数据并非那么困难。当然,我们也投入了很大的精力提升算法性能。今天城市大脑的性能相比最初的版本已经有20倍的提升”。

华先胜为ET城市大脑机器视觉技术负责人,视觉识别和搜索领域的国际级权威学者,曾获选国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM2015年度杰出科学家等荣誉。

他举例说,当规模小时多用一两台机器不会是什么问题;但当变成整个城市级别的计算时,性能差一倍,就可能带来上千台服务器的差异。据其透露,ET城市大脑正在研发测试全新的AI芯片,预计将会推动计算能力再次飞跃数倍。

全面、全量、实时的感知城市并能做出分析决策,是ET城市大脑有别于传统智慧城市方案最大的不同。“传统智慧城市解决方案就像是在建设城市的手和脚,但把手和脚绑到一起是无法产生协同、智慧的,中间需要一个大脑。”

据资料,ET城市大脑是阿里云推出的城市级人工智能中枢。此前已经在杭州、苏州、衢州、马来西亚、澳门等地启动建设。作为发源地的杭州,去年10月份城市大脑已经接管了杭州128个信号灯路口,试点区域通行时间减少15.3%,通过视频检测实现日均事件报警500次以上,准确率达92%;通过实时调度红绿灯,120救护车到达现场时间缩短一半。

阿里云的成功,吸引了大量的追随者进入。那么城市大脑标准是什么?华先胜在现场指出,除了全面、全量、实时之外,城市大脑一定是不依赖于硬件的。”不能为了建设城市大脑再去铺设摄像头。我们可以在不增加外场设备,不改变现有链路的情况下,通过云上的视觉计算,使得原有的普通摄像头具备多种智能。

这种能力强大到即使是同一个型号、颜色的车,在没有车牌的情况下,也能通过内饰等细微差别做出区分。基于这些技术突破,华先胜团队已经有多篇论文入选世界顶级人工智能会议。

阿里云ET城市大脑目前是四个国家人工智能开放创新平台之一。在华先胜看来,城市大脑将会成为整个城市的基础设施,基础设施之上开放了广阔的空间留给开发者。“城市大脑需要很多人一起来繁荣、一起来创造”。

以下为华先胜演讲实录,经品途商业评论整理编辑:

我之前讲城市大脑讲了很多次,今天是第一次在安防的会议上讲。上周第一次在一个交通的领域讲城市大脑,所以讲这个话题是有点忐忑的,因为以前在人工智能会议上讲的时候,下面坐的都是人工智能的人,没有几个懂安防的,也没有几个懂交通的,怎么讲都没事,今天在座的都是专家,所以讲的时候还要小心一点。

但是我又想,我们从人工智能的角度,从人工智能从业多年的技术人员的角度来看安防问题,也许能带来一些新的思考。另外一方面我今天要讲的内容也是我们团队经过两年的时间和交警、公安一起摸爬滚打出来的技术点、应用场景和系统,也希望能给大家带来一些启示。

“城市大脑”这个词两年前提出来的时候不像今天这样这么热,两年前是无人问津的,当时在阿里也只有我们团队和另外一个团队在探索这个领域。而今天不管是公司内部还是公司外部,很多人都说自己是做城市大脑的。我有时候讲我们是做正版城市大脑的,后来想想“正版”这个词有点打击面太广了,我们后来还是讲我们是做原创城市大脑的,所以今天跟大家分享一下原创的城市大脑到底是怎么回事,这里面是实实在在实战的城市大脑,也是正在运行的城市大脑。

城市大脑是怎么提出来的?它的背景就是因为AI技术的发展、算力的提升和数据超大规模的汇聚,所以使得我们在想,可不可以为城市安装一个大脑,去挖掘这个城市的价值,它的核心是用不断进展的AI技术和逐步增长的强大的计算能力挖掘城市里面大量的异构数据的不可替代的价值。这个价值体现在什么方面?可以从不同的角度来讲,数据智能助力城市管理和服务,全面、实时、全面的优化和干预,带来的必然是便捷和灵活。往上提一个层次就是城市管理领域、服务领域的突破和产业发展领域的突破。再往上提一层是城市安全管理。

现在的城市管理是什么样的,大家都是从事安防的都比我更清楚,第一点是盲人摸象,我们有很多单点、局部的交通和安防的感知,还有很多的设备是损坏的。覆盖量最大的视频,我们投入了很多钱建设视频的摄像头,但是这部分的资源没有充分的利用起来,我们可能用它做一个交通处罚,做一个事后的断案,但是它的价值远远不止这些。第二是灯下黑,很多城市尤其是比较早期的城市的摄像头是没有什么智能的,今天的智能摄像头也只是一部分,另外这个智能也是很有限的。我们怎么样充分地利用这些摄像头,把它的效能发挥起来?因为这些不可能靠人工来看。第三是雾里看花,所有的设备是单点,无法发现一些现象和问题背后的真实的原因。

这个事情提出来之后,我们就希望把这个城市各种各样的数据聚合起来,发掘它的价值,尤其是视频的数据。从一开始这个项目提出来的时候就面临了很多的挑战,不管是公司内部还是公司的外部,大量的挑战,今天还有人在挑战这些问题。总结起来,这些挑战可以总结为三个词:一是投入,我们要处理整个城市几万路、几十万路的视频,我们的投入有多大,不管是计算的投入还是带宽的投入,或者是算法研发的投入,这个投入我们撑不撑得住。在今天来说视频本来就已经传到了计算中心存起来了,它的带宽仅仅是从存储的地方到计算的地方的带宽,这根本不是什么问题。第二是价值,我们能从这些数据里面挖掘出什么价值,这些价值到底是锦上添花还是必须有的东西?虽然这个必须有有可能是创造出来的。我经常举个例子,就像今天的手机,过去手机都是打电话用的,没有很大的屏幕,都是一个小的显示屏,甚至显示屏都没有,今天手机没有大屏别人都不买了,这个大屏实际上是创造出来的不可替代的需求,成为一个刚需,城市的数据可不可以做到这样?我们在为城市数据创造价值的时候是不是也可以再到这样?第三是跟过去讲的智慧城市、视频监控有什么不一样?为什么我们做的这个城市大脑跟智慧城市的区别在哪里呢?虽然今天的时间有限,只能讲其中一部分,但是我希望讲完以后,还是让大家知道这是一个不太一样的东西。

什么是城市大脑?首先城市有大量的数据,有GPS、线圈、公交、微波等等,这些数据都会使用,视频数据是其中最大量的数据,也是潜在价值最大的数据,也是最难使用的数据,所以第一点我们要对它进行感知,或者叫做认知,要理解它,知道它发生了什么事情,整个视觉里面看到了什么,发生了什么,不管是车还是人,或者是事件、物体,我们都要了如指掌。了解这个之后,我们就可以进行决策优化,有的是直接感知认知之后马上就可以决策,比如说发生交通事故,马上就可以招呼交警去处理,如果是严重的交通事故,还可以把医疗资源马上叫过来。还有优化,比如说对红绿灯的优化,我们对整个城市的车流、人流等等有了全面的感知以后,当然可以做更好的全局的优化。还有就是把整个城市的视觉元素放到一个搜索引擎里面去,我不知道大家有没有玩过阿里巴巴很好的一个产品叫做拍立淘,把我们喜欢的东西拍一张照去淘宝里面找到相关的产品来进行购买。我们把城市里的要素放到搜索引擎里面去,当然它是实时索引,可能几秒钟之后,这个城市里面摄像头看到的元素都进入索引进行搜索。还有就是预测,我们对城市的趋势,无论是对交通还是对安全都非常重要,对交通而言我们知道要不要管控,对安全来讲,可以知道有没有安全隐患。我们也可以做更长时间的预测,比如说第二天会发生什么事情,比如说第二天天气很糟糕,要下大雨,有几个歌星要在哪里开演唱会,根据过去历史的数据,我们大概可以预测出来明天的交通状况是什么样子的,安全状况是什么样子的,哪里到哪里拥堵时间可能会超过很多。有了这些预测之后,我就可以最先进行预防,不管是警力还是医疗资源。另外我知道明天会发生什么,我能不能做什么事情不让它发生,我可以预先做交通的管控,做诱导。本来这个人明天要去那里,但是因为那个地方可能会发生拥堵,他的目的地不在那里,他当然可以避开那个地方,他明天不必要出行的话,他也可以不出行。还有一个就是干预,因为我们有了预测就可以进行干预。

整个城市级别的全局智能,我们把这样一套系统叫做城市的大脑。当然目前是以交通和安全两个领域为重要的应用场景,当然未来我们可能还会在其它的另外,在环保、能源、土地使用等等领域都会汇集到这个大的领域里来,甚至是规划都会汇集到这个大脑里面来。

我挑几个点介绍一些例子。

首先是感知层,城市感知的发展是经历了很多阶段的,最早叫无感无知,那时候想知道发生了什么,需要向别人了解。后来是感而不知,那时候很多公司装摄像头、装硬盘、装录像带,那时候安防不像今天这么高大上,今天安防行业都是人工智能最顶端的行业,那时候都是要人来监控的。到后来是感而略知,摄像头上有了一点智能。今天我们做城市大脑要做到感而全面知、感而全量知、感而实时知。

第一个是全面,全面也是随着今天算力的提升,使得我们对道路的情况,对摄像头看到的东西进行全面的感知,这里面不仅是能看到车牌,在一个质量很差的视频里,我们的算法依然要做到高精准、高速度和高性能,还要全面,对车、行人和抛洒物等等都要进行全面的感知。当然这些事情都是要在很短的时间内完成,因为还有很多其它的事情要做,可能在多少毫秒之内要把它完成。

这里我们费了很大劲做了一个算法,经常我们做目标检测的时候,有时候大的做好了,小的做不好,小的做好了,大的做不好,我们当时做了一个高效全尺寸多目标检测,大家有兴趣可以参考我们这篇文章。

基于这个结果,我们赢得了两项比赛的第一名,第一个是车辆检测,车辆检测在这个榜单第一名持续了一年时间。第二个是行人检测,持续了几个月也在第一名。

除了感知人、车、物之外,还要能感知事件。平时车流在正常通行的时候,这样的数据是大量的,异常的数据是少的,我们为正常的事情建模,异常的事情进来的时候,它就会有明显的反应。基于时空异常的检测,在这里面也有一些创新的工作,比说两个Branch的工作。

经过这样的分析之后,我们可以发现车与人相撞、车与车相撞、车与路相撞,人与人相撞等等,我们都可以进行检测。

刚才讲了两个事情,一个是物,一个是事。这里面有一个很大的事情,我们号称要在云端处理,到底能不能算得过来?在云端的计算能力有多强?这涉及到全量和实时这两个指标。

我们依靠阿里云的实时计算的平台,我们在这个平台的基础上建立大规模的实时处理的平台就没那么困难了,虽然也不是一件很容易的事情,因为它要处理的量非常大,计算也是比较难的。

这里面的成本是一个关键的问题,比如说一个事情要做得差一点的话,用了一两台机器不会有什么事,但是你要做这样一个规模的系统,可能需要好几千台机器,我们用了2000台,这是一个很大的系统,我们当时花了很大的精力提升它的性能,我们今天的性能相比第一版有20倍的变化,而且我们后面还有新的硬件的加入,又有了好几倍性能的提升。

我们具体在其中的一个例子是我们最近即将要发布的杭州城市大脑里面做的交警认为非常好的工作,这个产品叫做机器代替交警巡逻。大家知道城市里面有一类叫做枪机,一类是球机,球机基本上是没有什么智能的,我们今天的工作就是要让城市里大量的球机变得有智能,不管是交通违法还是交通事故,都可以让它进行监控。这是一个小的视频,这是在实时监控路上发生了什么事情,在几秒钟之内我们就可以测到这个地方发生了交通事故。如果要人去发现的话,基本上要10秒钟,现在通过我们的系统差不多也是10秒钟就能发现。

刚才讲的是感知层。再往后就是搜索和挖掘,这是实时进行处理的。我们在互联网上找东西可以通过搜索引擎来找,如果城市的管理者要找城市发生的事情,可以通过城市的搜索引擎来找,我们把城市里看到的人、车、路、物、事等等全部放到搜索引擎里去。做这件事情有两大挑战,第一个挑战是系统的挑战,也就是说你要去索引那么大量的数据,怎么能够让索引的搜索足够快,今天由于时间关系我就不讲这一部分,这也是阿里擅长的。第二个是我用什么东西去描述我们关心的这些对象,关心的那个车和那些东西,当然我们也可以用结构化的信息来做,这个车是什么颜色、什么牌子,这个人是男是女等等。今天我们可以用特征的方式来识别,它是一串数字,这串数字就代替了你所关心的这辆车、这个人的特征,我们通过这个特征进行目标的索引和检索。怎么样找这个合适的特征,怎么样把一个图片,一个目标变成一个特征,这是核心的课题,这里面有很多的方法,我们可以通过学习的方法,通过神经网络、目标函数的设计,可以逼迫神经网络收敛到我们想要去的地方,从而使它表达出我们想要表达的方法。

从上面来讲是从识别的角度逼迫神经网络,后面是通过VID的方法逼迫这个神经网络。

这里我只介绍其中一个例子,是我们前不久做的一个工作,就是Part-Leve特征学习,我们通过这个学习,在做索引的时候,在比较的时候,它就会成为重要的指标,当然还有一些方法可以发现到底哪些点是独特的,比如说像车的检索,我们做商品的车的检索的时候是比较简单的,同一辆车、同一个牌子、同一个型号认为是同一个产品,但是在安防的场景下,不是一个人的车,它就不是一个东西,这时候需要发现它的细小的差别,而且要自动发掘它。

我们这些工作也在行人RD-ID的一个测试里面应用,现在我们的测试结果是最好的,达到了97%,而人类的最好结果是94%。

这是车的检测,第二行红色的车是错的,如果从形状、颜色和车的大小来看是一样的,但是它不是一样的,如果用车牌识别是可以的,但是很多情况下车牌识别是不可靠的,所以我们需要通过小的特征来识别不同的车。

接下来是讲预测,虽然我们无法预测某个个体的行为,但是我们可以预测整体的趋势,我们在苏州做了这样的实验,预测车流在20分钟、30分钟后的变化。我们经常讲今天有GPS导航的时候,它其实是没有帮你做车流预测的,它仅仅是根据当前的车流给你选择一个最优路线,所以走着走着它给你建议不同的路线,因为交通状况在变化。如果我们有预测,GPS的路径规划就可以做得更好,如果时间更长的话,还可以进行更好的干预。这里面我们用深度学习的方法预测下一时刻的交通状况,这在苏州得到了很好的预测。

城市大脑的不同之处,第一是用大量异构城市数据中通过大规模计算和AI,挖掘其不可替代的价值。第二,城市大脑是在做人的智能不能完全的事情,因为它的复杂度、计算量已经没有办法用人力来完成,比如说红绿灯的配置、众多球机的观测无法通过人力完成,我们要通过城市大脑完成人不能完成的事情。我们经常讲人工智能有的地方是超越人的,有的地方是远远不如人的,在这个地方它是超越人的。第三,城市大脑还希望将来能成为一个城市的基础设施,就像水电煤一样。

深度学习、数据、计算能力使得AI有了发展,这个发展使得我们思考能不能为城市建造一个大脑,挖掘城市的价值,改变这个城市,改变我们在城市里的生活方式。由于这个城市的环境、城市的平台是非常独特的,它的数据的量、计算的需求,问题的复杂性、它对价值挖掘需求的量和迫切性使得城市可以成为一个平台,或者说城市大脑可以成为一个平台,去孵化更多的技术,有更多的创新在这个平台上能够发掘出来,使得一些科研的技术、实验室的技术在这个平台上得到锤炼,得到扎扎实实的实现。

这也是为什么城市大脑会被科技部选为首批四个国家人工智能开放创新平台之一。像阿里这样的公司就搭建一个台子,把它搭得漂亮,同时还需要有几个好的演员在上面演,不然大家都说这个台子不好,这个台子上最大的空间是合作者,不管是人的层次,还是数据应用平台、只能应用平台还是计算平台,在这上面可以创造更大的价值。

城市大脑需要很多人一起来繁荣、一起来创造,谢谢大家。


本文为 品途商业评论(https://www.pintu360.com)原创作品,作者: 赵子潇,责编:赵子潇。欢迎转载,转载请注明原文出处: 。本文仅代表作者观点,不代表品途商业评论观点。

您可能感兴趣的文章

阿里布局AI领域,城市大脑是人工智能的圣杯?

阿里云国际化落地首秀:希望把杭州城市大脑的成功搬到马来西亚

城市大脑海外首落地:阿里云的输出与挑战 | 创智记

发表评论

您的操作太快喽,请输入验证码

您输入的验证码不正确。

看不清? 点击更换
确定