2018年,AI几乎充斥了我们的生活,如果见朋友不聊点和AI相关的话题,似乎自己就与这个时代脱节了,近期高通骁龙855的发布再次把AI的关注度推向了高潮,从权威统计机构的预测来看,2018年全球AI市场规模预计为1.2万亿美元,到2022年有望达到3.9万亿美元。AI势不可挡的发展势头让各大科技公司不得不一拥而上,不管是做芯片还是做产品,统统都要和AI挂钩,大有“得AI者得天下”之势。AI已经在各个领域开始渗透,光AI音箱这一种亚马逊、天猫、小米就打得不可开交,其它智能电子产品更是不胜枚举,当然,这都不是今天的重点,今天我主要想谈的是AI芯片,今年推出的这些AI芯片看看哪些比较靠谱。
目前,笔者知晓的AI芯片有骁龙855、麒麟980、苹果A12、联发科P60、紫光展锐SC9863A和瑞芯微RK3399Pro,谁强谁弱先拉出来比一比:
1、骁龙855:张量加速器不等于独立NPU
骁龙855采用台积电7nm工艺制程,CPU为Kryo485(超级内核基于A76定制主频2.84GHz、性能内核主频2.42GHz、效率内核主频1.8GHz,1+3+4架构);GPU为Adreno640,与前代产品相比,渲染速度提升20%,支持Vulkan1.1/HDR/PBR。
骁龙855
在AI性能方面,骁龙855加入新的张量加速器(TensorAccelerator),专门负责AI,组成第四代AI引擎。可以实现每秒超过7万亿次运算(7TOPs),AI性能比骁龙845提高了3倍,比苹果A12每秒5万亿次运算(5TOPs)也高出不少。
高通的DSP数字信号处理器升级为最新的Hexagon690,具备四线程标量内核,性能提升20%,四个向量扩展核心(HVX),性能提升1倍,另外一个重要的改进是引入了张量加速器(HTA),自主设计,专为AI而设,支持多元数学运算、非线性方程、INT16/INT8与混合精度整数运算,大幅提升了机器学习算法的性能和能效。结合HexagonDSP、新的张量加速器,再借助更强的GPU和CPU完成终端侧神经网络运算,所有单元综合实现了专有的、可编程的AI加速。
但是,值得注意的是,骁龙855并没有配置独立NPU单元,其AI运算需要协调CPU、DSP、GPU等处理器单元,如果应用场景复杂,恰巧占用了这些处理单元,AI运算就要排队等候。也就是,其他公司的芯片的人工智能算力是独立算力,高通的AI运算是综合算力。
2、麒麟980: 配置双NPU
麒麟980采用7nm工艺制程,基于ARM的A76架构,主频是2.6GHz,八核心分别是2×A76(超大核)+2×A76(大核)+4×A55(小核),其中A76四个核心上采用了智能调度机制。相对于传统的大小核两档位设计,麒麟980让CPU在重载、中载、轻载场景下灵活适配。
在AI配置上,麒麟970搭载了一个NPU(神经处理单元),其专门负责AI运算,在大幅提高手机AI性能的同时降低了AI任务功耗。麒麟980则配置了两个NPU,因此在ResNet-50图像识别测试中得到了4500张每分钟的成绩。整体来看,相较于麒麟970,麒麟980的CPU性能提升75%,能效提升58%,内置的10核GPU Mali-G76让性能密度号称提升30%,能效提升30%。
3、苹果A12:搭载8核神经网络引擎
A12采用7nm技术,内部有69亿个晶体管,采用六核CPU设计,相比A11处理器,其中两个大核心性能提速15%、功耗降低了40%,四个小核心功耗降低最多50%。A12采用自研四核GPU,性能相比A11的GPU性能提高50%,并强化了对AR混合现实的支持,支持曲面细分、无损内存压缩和实时多层渲染功能,AR性能获得大幅度提升。
关于AI性能,苹果A12还搭载了八核神经网络引擎,其运算速度达每秒5万亿次,远超A11的每秒六千万次,可以更独立机器学习,支持多精度,智能计算系统。同时,苹果还将神经网络引擎开放给 Core ML 平台,开发者可将机器学习技术应用到自己的 app 中,让学习过程在用户的 iPhone 上进行。提升了Siri易用性、使A12芯片的机器学习能力相比之前能够提升9倍,而能耗则降低到原来的十分之一。