科大讯飞技术又攀高峰,自动驾驶图像技术登顶,刷新世界纪录

摘要:科大讯飞在自动驾驶领域技术又宣布重大突破,在自动驾驶领域内最具权威性和专业性的图像语义分割评测集Cityscapes评测数据集的评测中,讯飞开发的iFLYTEK-CV,在像素级语义标注评测中位列榜首。

11月1日,科大讯飞在自动驾驶领域技术又宣布重大突破,在公认的自动驾驶领域内最具权威性和专业性的图像语义分割评测集Cityscapes评测数据集的评测中,讯飞开发的iFLYTEK-CV,在像素级语义标注评测中位列榜首,超过了motovis、deeplabv3以及pspnet。

  

Cityscapes其关注真实场景下的城区道路环境理解,任务难度更高且更贴近于自动驾驶真实场景。评测集中包含50个城市不同情况下的街景,以及30类物体标注。此次科大讯飞参加的像素级场景图像语义分割评测,类别对象多、场景复杂,挑战难度大。Cityscapes使用标准的PASCAL VOC IoU(intersection-over-union)得分来评估预测结果与真实场景之间的匹配准确度,每个像素点的预测结果都会直接影响到最终得分。 

此次评测,科大讯飞借鉴了已在教育图文阅卷中成功应用的复杂版面分析技术,并结合道路场景解析的特殊问题进行算法迁移,构建了一套具有丰富上下文信息的多层次图像语义分割方案。 

科大讯飞发文表示:根据道路场景下不同对象间的空间关联性,科大讯飞设计出多层次模型预测框架,将多类别“难例预测”简化并分治,同时借鉴多尺度混合感受野的模型设计,加入基于预测对象尺寸自适应调整权重的过程,对上下文信息和物体结构性信息进行更有效地利用。

 

左:真实场景  中:场景标注  右:讯飞算法预测结果

像素级场景图像语义分割被喻为自动驾驶中目标识别模块最精确和难度最大的算法,分割的结果可以为行车电脑提供更加丰富和全面的路况参考信息,为后续高级别自动驾驶中的路径规划以及相关的决策提供指导依据。相比于行人检测、物体识别等算法需要系统再次推导空间路径,图像语义分割算法的输出使得整体决策流程更加简化,缩短判决时间的同时又不失安全性。 

高精度图像语义分割技术为驾驶控制提供更准确的决策参考,其算法效果上每一次细微的改进,都可能意味着真实环境中判决失误次数的极大减少,由此导致的事故率也随之降低,这正是自动驾驶真正诉求的价值所在。 

科大讯飞从语音技术被大家熟知,但实则其产品线已经深入众多行业应用,通过语音技术的入口,科大讯飞已经在智能家居、教育、医疗、商务、公务、司法等领域,并且科大讯飞的图像技术也达到了行业领先水平,医学影像识别技术已经在国际上得到了第一排名。 

科大讯飞表示,在不断的将技术落地的同时,科大讯飞会将更多的技术公开,由更多的开发者来打造更优质的技术能力,据悉,科大讯飞研究院人数已达到近一千人,研究能力有望突破更多技术瓶颈。

 


本文为 品途商业评论(http://www.pintu360.com)原创作品,作者: 王航,责编:冯群英。欢迎转载,转载请注明原文出处: 。本文仅代表作者观点,不代表品途商业评论观点。

您可能感兴趣的文章

揭百度研究院幕后故事:已成名副其实人工智能黄埔军校

亮眼!百度Q3财报公布,信息流业务超10亿美金,AI战略起作用呢?

华兴资本包凡:中国人工智能投资正在探索新机遇

发表评论

您的操作太快喽,请输入验证码

您输入的验证码不正确。

看不清? 点击更换
确定