思必驰高始兴:十年赌语音交互,从寒冬的孤守者到人工智能新贵

摘要:”我知道这个行业会爆发,但真的不知道是哪一天。“

去年十一月,搜狗、百度和科大讯飞接连召开发布会,几乎在同一时段宣布各自中文语音识别准确率达到了97%。 

然而,这个令人兴奋的数字,却有一个先决条件——只能适用于安静的、近距离的环境下。 

换句话说,97%的准确率目前只与手持移动终端相匹配。在物联网场景下,这个数字难以作为背书。 

而这往往成为人们对语音交互应用的认知误区。 

“识别率达到99%也没用,因为现在的核心问题是怎么做好语音交互,而不是语音识别。” 

思必驰创始人兼CEO高始兴对品途说,人机对话的核心不单是语音识别,当把语音技术真正应用在物联网,交互就不单要依靠耳朵,还要结合更多的理解,包括结合大脑的对话,结合语音合成,甚至未来对眼神、情绪的判断。

思必驰的红海策略

在人工智能领域,我们经常听到搜狗、百度、科大讯飞这些大厂,而由于一直在B端默默耕耘,思必驰这个公司的名气,相较于它的功绩,是被低估了的。 

它是世界人机对话挑战赛的冠军;而在国际评测中,思必驰的错误率是7.09%,超越了10%的国际水平;另外,在高盛“全球人工智能生态报告”中,国内只有两家公司入围高盛名单“全球最具竞争力的人工智能公司”,其中之一就是思必驰。 

技术领域内,思必驰在全球也是领先的。 

语音识别在不同的场景里,会面对大量的技术挑战,比如噪声,比如距离,高始兴解释称,“现在一流的语音公司,在手机上的语音识别基本都很高了,但手机我们是拿到嘴边,定向的输入,而使用智能音箱、智能电视、智能机器人时,是有一段距离的,还有噪声的干扰,我们不可能对电视去喊。所以真正将交互做好,绝对不仅仅是语音识别,还有声学和信号处理等多方面问题,在物联网和一些行业应用中很复杂,会有几何倍数的挑战。” 

尽管技术研发上很有挑战,但人工智能现在发展依然火热,这个热代表是钱热、涌入的竞争对手多,资本依然具有翻云覆雨的能力。 

在这片红海里厮杀,有些企业遍地开花,有些则专攻垂直领域。但这个领域边际广阔,想要崛起,高始兴的词条是“极致”,这意味着思必驰选择了深扎垂直领域。 

在被寄予厚望的AI未来世界,思必驰走向极致的路径,一是要靠专注,二是靠技术驱动。 

“人工智能这种技术,它还是很创新的,落到不同的行业,周期、挑战都特别大,无论是教育、物联网还是金融医疗……不专注你就肯定做不到极致;而且这里边一定是技术驱动的,专注于对行业的理解,迅速把技术原形到产品原形,再到产品、商品形成一个循环。这就是为什么思必驰做智能硬件,并且有这么大的研究团队。” 

思必驰还实行产学研一体化,与上海交通大学成立智能人机交互联合实验室,由思必驰首席科学家俞凯负责,主要从事前沿和底层的技术研究,相关技术成果和知识产权都归思必驰所有并转化。 

思必驰团队目前超过300人,其中做底语音技术的近百人,这在国内面向物联网市场的企业中,规模屈指可数。

站稳垂直领域:车载、家居、机器人

一般整个产业链达到成熟,往往是产品端已经做到了极致,从渠道端能够铺下去,随后内容生态越来越丰富。就像当年的苹果,它将体验和生态做到极致,随之让用户的使用得心应手。 

对于思必驰来说,车载、家居、机器人,是其专攻的三大垂直领域,并希望以此来达到苹果公司所创造的极致用户体验。 

思必驰所提供的产品服务,一方面是思必驰对话操作系统AIOS系统(AISpeech Operating System思必驰人工智能操作系统)——运行于Android、Linux、阿里云OS等主流操作系统之上,目前主要用于车载领域(AIOS For Car)和家居领域(AIOS For Home);另一方面是软硬一体化的芯片模组。它提供声源定位、个性唤醒、语音识别、语义理解、多轮对话等功能,主要用于家居和机器人领域。 

目前,思必驰针对家居和机器人领域,推出四麦线性阵列和环形六麦阵列等软硬一体化的解决方案。另外还跟君正、庆科、全志等芯片厂商建立战略合作,推出内置语音交互的芯片模块。 

智能车载 

智能车载是思必驰最重要的领域,在智能后视镜市场,思必驰占据着60%左右的市场份额。 

语音交互是车内的刚性需求,据统计,国内30%的交通事故是打电话、看微信导致,因为没有其他的交互手段,语音交互成了最自然的刚性需求。 

另外,无论是前端还是后端,车联网的整个产品体验都在提升,越来越多人不再把车当成交通工具,而是一个生活空间。这一空间定位的转变,自然就会带来更多服务,语音交互也成了最主要的调用方式,目前国内机动车保有量在3亿左右,每年的出货量是2500万,据高始兴预计,5年以后,市面上30%~50%的机动车,都会有语音交互系统。 

“这很吓人的,假设咱们说30%,即使按3亿的保有量来算,就是9000万,接近一个亿的车载用户代表着什么?” 

“车联网语音交互的活跃度是50%,你要知道在手机端上能达到50%的,除了微信可能也就只有支付宝,这个量级其实是很恐怖的。” 

智能家居 

而在智能家居市场,亚马逊Echo的出现带火了整个行业,也带动了智能语音技术在家居领域的广泛应用。目前,思必驰在家居领域的落地产品包括智能音箱、智能电视、冰箱空调、路由中控等硬件设备,而最近大热的音箱类目,小米互联网音箱、联想智能音箱、阿里天猫精灵X1,均采用了思必驰的语音技术。 

微信图片_20170708165750

“物联网是个长期的市场,现在智能音箱非常火爆,但这类智能终端如果仅仅只有语音识别的能力,那还只是玩具,它真正需要的是语音交互。为什么亚马逊的Echo出来后,很多企业都开始做智能音箱?是因为它是一个生态。它通过人工智能的赋能,让终端成为智能终端,智能终端什么意思呢?用户无所不为。无论是给设备放到本地也好,放到云端也好,一定是需要整体的语音交互系统,人工智能操作系统。这在中国是迟早的事,但不一定是智能音箱,我们只是看到它浮出来了,所以我们要试一下。” 

智能机器人 

思必驰合作的机器人厂商也以家庭陪伴和育儿机器人为主,客户包括乐橙机器人、小萝卜机器人、360发布的小巴迪、360小巴迪和其生态链机器人金刚蚁小忆等,都采用了思必驰的智能语音技术。

迎接爆发

“我知道会爆发,但真的不知道是哪一天,因为预言不可能那么准。” 

2007年移动互联网方兴未艾,PC上已经有语音的应用,但场景有限。高始兴的团队在英国剑桥成立,并在2008年回国,团队核心技术人员均来自剑桥大学,去年被苹果收购的语音技术公司VocallQ的创始人,正是他们创立剑桥公司时的合伙人。 

2011年苹果的SIRI发布,高始兴为之一振,他意识到语音技术的春天不远了,“当时我们在后台的数据提升非常快,这也说明这个事的用户价值体现越来越明显。” 

按照高始兴的解释,现在的思必驰准确来说始于2012年。“2007年的业务我们已经打包卖掉了,因为我们那个时候还是研究院的品牌,对我来说,最大的转折就是在2012年。” 

思必驰之前曾将语音技术应用于英语口语教育业务,后来获得联想之星和启迪等三方联合投资,逐步把人力、精力及资本都专注到了智能硬件领域,并将口语教育业务剥离,成立子公司——驰声科技,后被网龙全资收购。 

在2016年初,思必驰B轮融资中拿到阿里巴巴的2亿人民币,继续加快市场拓展和海外布局。时隔半年,在2016年9月,思必驰又拿到一轮新的巨额融资,思必驰逐渐成为了资本追逐的目标。 

人机交互的很多理论,源自人与人交互的研究,尤其是社会心理学、认知心理学、认知神经科学等等,TheMedia Equation更是为此奠定了理论基础,这本“圣书”核心的观点就是人与计算机的交互行为,与人人的交互是高度相同的,很多时候甚至是潜意识的。 

尽管有学术根据,也有大批量的资本入局,但直到目前,人们对语音交互是否能真正成为下一代的入口,依然存在争议。但从2007年的蒙昧时期开始,高始兴就笃信这个未来,而且认定这个需求会越来越大。高始兴和他的团队已经用了10年时间来证明他们的判断,并在国际技术领域留下浓墨重彩的一笔,我们无法具象地描述人工智能的时代会是什么面貌,但可以肯定的是,正是这样一批人推动着时代变革,并重启商业世界的规则。  

对话高始兴

品途:为什么在语音交互上,思必驰以及国内的技术会在全球异军突起? 

高始兴:几个方面:第一,在国际上做语音识别也好,人机对话也好,我们是蛮早的,特别是人机对话。另外我们的首席科学家俞凯,是几个大的国际语音项目的核心系统搭建人,人机对话的奠基,他也是参与者之一,一个公司或者一个研究方向,领军人物非常关键。第二,思必驰创业10年,我们一直是技术驱动型的公司,人工智能时代技术驱动非常关键,而且核心人才我们基本上没怎么流动,还招了一批剑桥、来自于香港、新加坡、以色列,包括清华、北大、中科大、中科院、上海交大、南京大学的优秀学生。第三,任何一个技术都有产业化的楼梯,我们一直在结合产业去做,而且相对比较聚焦,我们会聚焦到物联网,在这儿做的很扎实。底层的技术你要做的工程化,做到产品化、商业化还是有很多挑战的,其实当你完成这个路径以后,很多数据过来,对场景的理解,行当的理解,就是有助于你这个技术提升。 

品途:整个供应链上议价空间最大的是否还是语音技术? 

高始兴:应该说是。因为第一,语音技术是这个产品的核心定义,其核心的智能还是语音智能、语音交互;另外,它是一个入口,没有入口不行,而且你没有第二个交互界面。 

品途:你眼中的科大讯飞? 

高始兴:我觉得第一他们是非常了不起的,你想我们在2007年开始创业,我管那时候叫“冬天”,但他们在1998年就开始了,那是寒冬,什么人工智能,当时也没有这个说法,那时候更没人知道语音识别;第二,这个行业其实还处在春天,甚至是在初春,未来的5到30年,是一场第四次工业革命。相比来说,讯飞是遍地开花,类似于一个草原生态,而思必驰,我觉得是一个大数据平台,就是Focus在一个领域,找一个能够叶茂枝繁的路径。

本文为 品途商业评论(http://www.pintu360.com)原创作品,作者: 尹磊,责编:孙鸣曦。欢迎转载,转载请注明原文出处: 。本文仅代表作者观点,不代表品途商业评论观点。

您可能感兴趣的文章

儿童智能机器人成下个风口,科大讯飞投资布丁

科大讯飞胡国平:人工智能的热潮下,怎样实现产品落地?

语音输入法成大势所趋,百度、讯飞或将靠技术逆袭

发表评论

您的操作太快喽,请输入验证码

您输入的验证码不正确。

看不清? 点击更换
确定