非常抱歉,由于一些个人原因,从清明节过后断更了几篇。给大家添麻烦了,今天又恢复更新拉。
这几周其实国内的大事件就要属2年一次的上海车展盛会啦。每次车展都会展示出很多新奇的东西以及未来的一些技术动向。
本次车展上自动驾驶大放光彩,不光是传统车企的ADAS功能展示或者自动驾驶的规划,还是初创车企或者初创自动驾驶企业的方案展示,还是辅助自动驾驶所必需的传感器,计算平台等等,都在本次车展上做了一些发布。
关于车展的自动驾驶相关的报道,我就不再做出详细说明了,好多媒体以及公众号都有过详细报道。
(什么没看到?那看车智的文章链接吧。2019上海车展:自动驾驶的崛起)
本文还是主要聊聊自动驾驶里面的一些东西,今天就和大家一起聊聊计算平台。
众所周知,自动驾驶任务非常复杂,意味着开发人员需要兼顾软件和硬件的协同。当前几篇里所说的传感器接受到信息后,导入到计算平台,由各种芯片处理。因此计算平台的选择会直接影响到自动驾驶系统的实时性和鲁棒性。
为了保证自动驾驶的实时性需求,软件响应的最大延迟必须在可接受范围内,这对计算资源的要求相应的变得极高。目前,自动驾驶软件的计算量达到了10个TOPS(每秒万亿次操作)或者更高,这使得我们不得不重新思考对应的计算架构。
那么我们来聊聊计算平台多少种方案?
1,基于GPU
GPU有多核心,高内存带宽的优点,所以它在并行计算,浮点运算时性能时CPU的数十倍甚至上百倍。特别时当人工智能在自动驾驶广为应用的时候,使用GPU运行深度学习模型,在本地或者云端对目标物体进行切割,分类和检测,不仅花费时间缩减,同时比CPU更高的应用处理效率。
就如NVIDIA当年发布会上的对比一样。
然后下图时CPU的处理信息
而这个时GPU的处理信息。
所以,GPU凭借强大的计算能力以及对深度学习应用的有力支持,GPU正逐渐成为自动驾驶技术开发的主流平台解决方案。
说到这个就一定要说说NVIDIA了。
英伟达在其自动驾驶汽车平台上投入巨资,提供了开发和运行汽车AI所需的一整套硬件和软件。英伟达最近宣布其下一代驱动AGX平台和驱动星座模拟器的可用性。
该公司正在建设帮助开发和测试人工智能模型的基础设施。除了快速的人工智能芯片,英伟达还为客户提供了一个云平台,用于培训和测试基于“软件定义的汽车”的人工智能模型,以加速安全自动驾驶汽车的开发和测试。英伟达在中国的投资令人印象深刻,数千名工程师和数千台专用gpu已经到位。一款安全的自动驾驶汽车必须克服的障碍是惊人的,英伟达正在利用人工智能、VR和超级计算技术,与尽可能多的汽车公司一起率先进入市场。
自动驾驶汽车行业必须应对的挑战,比人类登月等困难许多数量级。考虑到这一点,在我看来,英伟达的端到端方式对丰田、戴姆勒奔驰、大众、奥迪、沃尔沃等公司将是非常有吸引力的,更不用说像博世、大陆和ZF这样的一线供应商了。硬件为计算、功率和价格提供了广泛的选择,汽车制造商可以在此基础上开发支持其品牌的独特驾驶体验。
2,基于FPGA
FPGA就是现场可编程逻辑门阵列。它其实就是一个高能低耗的可编程芯片。用户可以自定义芯片内部的电路连接来实现特定功能。而且时可擦写,所以用户可以根据不同时期的产品需求进行重复的擦了写,写了擦。
这个其实已经存在很久了,长期在通讯,医疗,工控和安防等占有一席之地。
相比GPU而言,它的主要优势在于硬件配置灵活,能耗低,性能高以及可编程等,比较适合感知计算。目前出现针对FPGA的编程软件平台,进一步降低了准入门槛,使得FPGA在感知领域应用非常广。
就拿前几年上市的奥迪A8来说,它里面搭载了zFAS平台,其中由Altera提供的的Cyclone V SoC就是基于FPGA技术打造的视觉解决方案。可以说是最早的在车上的应用吧(如果不对请及时提出哈)。
这里面的巨头就不得不提收购深鉴科技的FPGA巨头:赛灵思了。
作为FPGA的发明者,赛灵思发展至今取得了不少傲人的成就,是全球首个无线晶圆发明者,现在全球拥有4300多项专利。
赛灵思的嵌入视觉解决方案主要包括计算机视觉和机器学习。
而在实际应用中,ADAS在嵌入视觉方面一般有低时延、低功耗和低成本三大要求。“很多工程师可能会立马想到看上去完美符合这三项要求的ASIC。但我想提醒一下,人工智能的发展速度非常快,每天都会产生大量新的神经网络,这就意味着ASIC得具有高度灵活性才能跟上快速的上市进程。赛灵思的SOC通过片内缓存数据的方式,搭载上大量的线上内存,最终有效降低了系统时延。
3,基于DSP
DSP也称为数字信号处理器,是一种特别适合进行数字信号处理运算的微处理器。它在数学运算以及数据移动方面有着优异的性能。
这个相对来说美国德州仪器(TI),是这个解决方案的领导者。
它推出了TDA2x汽车系统芯片SoC,在低功耗封装中将高能,视觉分析,图形以及通用处理内核进行结合,实现包括迁至相机,环视等在内的ADAS应用。
而且授权的CEVA公司发布的图像和视觉处理产品CEVA-XM4可以支持实时三维深度图生成和拥宇三维点云数据处理。功耗只有现GPU的10%左右。
典型的混合式CPU/GPU的处理架构方案相比,建基于DSP架构的CNN引擎,能提供高达近三倍的性能。而且,DSP引擎除了所需电源比GPU小30倍之外,所需的内存带宽,也只有约GPU的五分之一。CNN算法,属于乘法和加法密集型(Multiply-accumulate, MAC),因此本质上十分适合运用DSP。也就是说,若要在嵌入式系统中实现CNN,DSP不仅能够取代GPU和CPU,而且成本和功耗更低。
4,基于ASIC
ASIC就是专用集成电路,是为某种特定需求而定制的芯片。一旦设定制造完成,内部电路以及算法就无法改变。它的优势在于体积小,功耗低,性能以及效率高,大规模出货的话,成本非常低。
它和FPSG最明显的区别就是,FPSG就像乐高,可以在开发过程中各种变更,但是量产后成本也降不下来。ASIC类似开模生产,投入高,量产后成本低。所以一般前期开发阶段多用FPSG,量产多用ASIC。
这里比较知名的应用ASIC技术开发芯片的厂商就是Mobileye了,已经被英特尔收购了,而同样也是被英特尔收购的Nerbana也是属于ASIC芯片供应商。
总结
尽管现阶段采用GPU架构、GPU+FPGA异构化、ASIC架构的车企并行存在,但综合来看,车企更倾向于选择ASIC专用型芯片,以自身更好的软件算法同时满足高性能和低功耗的要求。
专属AI芯片的研发只有少数科技巨头如谷歌、英特尔参与其中。国内如地平线是面向中国智能驾驶场景所研发的专用芯片,相比Mobileye,其芯片方案要更适合于中国场景,这是国内企业在AI芯片领域的突破,也是具有创新性的中国方案。
此外,国内寒武纪、西井科技等也在AI专用芯片领域有所布局。
通用芯片GPU、CPU、FPGA在某些特定场景下会造成功能浪费,面积和功耗的冗余。ASIC专用芯片可以根据特定的算法实现计算能力和计算效率的专用定制化,随着各类应用场景在自动驾驶不同领域的渗透,即时性应用场景在深度学习上所需要的推理能力越来越强,在云端进行软件升级并进行计算已无法满足特定场景的即时性要求(5G时代的来临或许有可能解决这一数据传输速率的瓶颈),因此,各类应用场景将推动AI专用芯片的研发。
综上所述,各芯片架构并存的现象还将会延续一段时间,在自动驾驶车进入量产阶段后,GPU、CPU将会更广泛应用于一些较为通用的场景,大规模AI芯片的需求量将使ASIC前期的成本显著降低,车企选择ASIC架构的AI芯片或将成为趋势。因此,国内AI初创企业应紧跟自动驾驶对于AI芯片的需求,针对中国智能驾驶应用场景,采用软硬件一体的结合方案,使算法在硬件上得到最优化,从而在与整车厂的合作中,能够针对特定需求定制芯片,扩大自身优势,在AI芯片领域占据一席之地。