6月20日,CVPR 2021自动驾驶研讨会(Workshop on Autonomous driving)揭晓了本年度谷歌无人驾驶公司Waymo开放数据集挑战赛的最终结果,地平线感知算法团队凭借AFDetV2模型获得了实时3D挑战项目的第一名,另一个模型则荣获Most Efficient Model(最高效模式)头衔。这是继2020年荣获5项挑战中4项全球第一后,地平线再次摘得桂冠。
在实时2D挑战项目中,中国的零跑汽车团队在2D实时检测挑战赛中斩获了第一名。
每项挑战的得奖团队获得1.5万美元现金奖励,第二名团队获得5000美元,第三名团队获得2000美元。
地平线再次夺冠
研讨会精彩纷呈
CVPR 2021自动驾驶研讨会旨在聚集学术界和工业界的研究人员和工程师,讨论自动驾驶感知的最新进展。为期一天的研讨会包括论文发布、特邀演讲和技术基准挑战,以展示当前的技术水平以及计算机视觉在自动驾驶中的局限性和未来方向,以及计算机视觉和人工智能(AI)最有前途的应用。
演讲者
论文的主题包括:自主导航与探测;基于视觉的高级驾驶辅助系统、驾驶员监控和高级接口;无人机和水下机器人视觉系统;车辆技术中的深度学习、机器学习和图像分析技术;车辆应用性能评估;采集系统(如相机、雷达、激光雷达)的车载校准;三维重建与理解;基于视觉的定位(例如,位置识别、视觉里程计、SLAM)等。
群雄逐鹿,方显英雄本色
自动驾驶(AD)将对人们的日常生活产生了重大影响,开发自动化车辆已成为工业界和学术界的核心兴趣所在。随着人们在这一领域的发力,与AD相关的所有技术都取得了长足进步。
那么,怎样要证明一家公司在自动驾驶领域的实力呢?答案是:来Waymo开放数据集挑战赛一决高下!
作为全球自动驾驶公司王者,2020年3月,Waymo首次在CVPR自动驾驶研讨会期间举办Waymo开放数据集挑战赛,宗旨是以模型导向,以算法为王。Waymo首席科学家兼项目负责人Drago Anguelov表示:“我们的数据集是有史以来规模最大、场景最丰富、最多样化的自动驾驶数据集之一。”
大规模数据收集
作为自动驾驶领域中算法研发方面最著名的国际性大赛,本届Waymo开放数据集挑战赛旨在鼓励对感知与行为预测进行新的研究。为此,Waymo开放了其自动驾驶车辆在25个城市收集的超过1000万英里、570个小时的自动驾驶道路数据,超10万个城市真实场景。大赛吸引了包括清华、滴滴、赛灵思、伯克利、德克萨斯大学、南洋理工大学等在内的30余支学术界和产业界顶尖自动驾驶研发团队的参与。
为了解计算机视觉算法在解决自主驾驶环境感知问题方面的现状,主办方提出了两个挑战,准备了由Waymo和Argo-AI收集和注释的大规模数据集。基于这些数据集定义了许多现实问题,鼓励业界为自动驾驶发明新的算法。Waymo开放数据集挑战赛共设四个现场项目,包括动态预测、关联预测、实时2D检测及实时3D检测。
运动预测挑战:给定实体(agent)对应地图上过去1秒的轨迹,在未来的8秒钟内预测最多8个实体的位置。
交互预测挑战:给定实体在对应地图上过去1秒的轨迹,预测2个交互实体在未来8秒内的共同未来位置。
实时3D检测:给定三幅激光雷达测距图像和相关摄像头图像,为场景中的对象生成一组3D直立框。
实时2D检测:给定一组摄像头图像,为场景中的对象生成一组2D框,有延迟要求。
力压赛灵思夺得头筹
地平线连续两年参加Waymo自动驾驶算法挑战赛,连续两年斩获殊荣。相比上届,本届Waymo比赛实时3D检测难度更高,实时性要求更接近实际场景。结果,地平线力压赛灵思、德克萨斯大学等公司和高校团队,其AFDetV2模型夺得实时3D检测第一名。该项目要求实时性,在小于70毫秒时间内精度最高者为第一名。地平线提交的另一模型AFDetV2-Base摘得Most Efficient Model称号,是速度最快的模型,同时模型精度大于70APH。
CVPR 2021公布获奖页面
值得一提的是,地平线连续两年参加3D物体检测项目,去年的模型至今为止仍是Waymo竞赛榜单(LeaderBoard)上检测精度最高的模型;而今年的模型在实时性检测的榜单上又名列第一。同时拥有3D物体检测精度最高和实时性最高的3D物体检测模型,充分体现了地平线世界领先的算法实力。
感知能力是自动驾驶的起点和基石。地平线通过“算法+芯片”软硬结合,面向智能驾驶场景,聚焦视觉感知,提供智能驾驶核心解决方案。地平线团队此次在实时3D检测项目的表现展现了其高水准的智能感知能力。一系列关键技术实现不仅是地平线团队对先进算法的创新性运用,也体现了其强大的工程能力,能够在贴合实际应用场景的前提下,实现高精度、低延迟,不断提升感知的准确性。
攻克模型运用关键技术难点
实时3D对检测精度和速度都有极高的要求。如何能够最有效利用计算资源是此次竞赛的核心问题。
凭借对3D物体检测的多年技术积累,在模型设计上,地平线团队选择了无锚单阶段(Anchor-free Single-stage)目标检测方向,这与去年提出的核心算法AFDet的思路一致。在修改算法的基础上又做了一系列提升,包括:加入基于交并比预测(IoU-prediction)的重打分(rescoring),以解决分类热图(classification heatmap)与定位图(localization map)的不重合(mis-alignment)问题;在RPN(风险顺序数)环节中加入自校准卷积(self-calibrated convolution),提升网络的感受野(receptive field),更好地处理语义信息;在训练的监督中加入特征点(keypoints)的辅助分支;同时在模型训练的最后阶段利用随机加权平均(stochastic weight averaging)进一步提升模型的泛化性。这些技术大幅提升了原有模型的检测精度,且所增加的计算量基本上可以忽略。
据介绍,为了满足实时性要求,地平线分析了模型中每个部分的耗时,发现模型的前处理部分和特征提取部分是实时性瓶颈。对此,团队做了算法和工程方面的改进:首先调整了特征提取网络结构,凭借经验在原有网络基础上做了网络结构搜索(network architecture search),最终选择了“减少前端残差网络(residual block)数量,且减少Z方向上采样卷积数量”的网络结构,在精度和速度上做了平衡;接着,对前处理部分的体素化(voxelization)做了并行处理优化,释放了原有算法中对每个体素中点数的限制,极大地提升了(速度提升17毫秒)处理效率;最后,把模型中的批量标准化(batch norm)参数融合进卷积参数,进一步提升了模型速度。
这些关键技术的实现是该团队对先进算法的创新性运用,也是其强大工程能力的体现。
造车新势力也有斩获
在Waymo挑战赛上,零跑汽车获得自动驾驶算法挑战赛2D实时检测第一名。得益于视觉识别技术的沉淀与经验积累,零跑团队取得了不错的成绩。2D实时检测赛道主要考验选手两个方向,一是算法模型对障碍物检测分类的准确性;二是算法模型在设备上跑的速度能否达到实时性。
零跑汽车获得2D第一名
此前,还真没有听说过零跑汽车,现在才知道这是一家拥有IT基因,属于“IT人造车”的汽车公司。其自诩为创新型智能电动汽车企业,是拥有智能电动车完整自主研发能力的整车厂家。
零跑汽车由浙江大华技术股份有限公司及其主要创始人共同投资成立,始终坚持核心技术的自主研发,致力于打造高品质、国际化、具有核心技术能力的全球主流智能电动车品牌。
去年,零跑汽车发布了首款完全自主知识产权的智能驾驶芯片——凌芯01。该芯片由零跑汽车携手国内芯片企业耗时3年联合开发,据称处理性能接近市场顶尖的Mobileye芯片。
据介绍,凌芯01整体开放性更强,既能支撑通用运算,又有特定的AI运算逻辑,具有能耗比更低、安全可靠性更高的优势。凌芯01的核心CPU处理器采用了阿里旗下平头哥半导体公司提供的“玄铁C860”处理器,集成高性能的AI神经元处理器,全面提升芯片核心处理速度与效率。
此外,凌芯01可通过PCIE级联技术,实现多片组合形成计算平台,提供更强大的AI算力。凌芯01支持接入12路摄像头来实现2.5D的360°环视,并可支持自动泊车、ADAS智能驾驶辅助域控制,以及接近L3级别的自动驾驶算力,充分满足用户对于车辆智能驾驶与主被动智能安全的行车需求。
作为零跑汽车首款高端纯电动SUV车型,零跑C11将率先搭载凌芯01,采用整套完全自主知识产权的智能驾驶解决方案,从芯片级打通整个智能驾驶系统。C11出自零跑自主开发的纯电模块化C架构,配备海格力斯三合一电驱系统,搭载最新一代高通骁龙8155平台的三联屏智能车机,搭载Leap Cloud系统。此外,C11还配备有蓝牙钥匙、人脸识别、适配个性化调节、智能空气净化系统,为消费者带来极致的智能化体验。
零跑自品牌创立以来,始终坚持核心技术的自主研发。在技术储备方面,零跑是国内极少数拥有智能电动汽车完整自主研发能力并掌握核心技术的厂家。
芯片是自动驾驶的基石
新一轮科技革命和产业变革将推动自动驾驶产业再上新台阶。早在2010年,地平线创始人兼CEO余凯博士便带领团队斩获了首届ImageNet图像识别评测第一名,被誉为“最懂算法的AI芯片公司”,如今在Waymo挑战赛再次蝉联第一,而中国的造车新势力也已跻身其中,这不能不说是中国汽车芯片及算法领域的一件幸事。
可以说,这两家公司不只是学霸,而是实绩有目共睹。搭载地平线征程芯片的已有长安、奇瑞蚂蚁、智己汽车、广汽AION Y、岚图FREE、江淮汽车思皓QX、广汽传祺GS4 Plus、上汽大通MAXUS MIFA、2021款理想ONE等车型。而凌芯01是自研自用,上车也不是问题。
我们期待,未来这样的芯片厂商和车企从底层芯片赋能,加快开发自主智能驾驶算法,加速智能驾驶的落地进程。