4、联发科Helio P60
联发科Helio P60采用ARM Cortex A73和A53大小核架构,采用八核心大小核(big.LITTLE)架构,内建四颗ARM A73 2.0 Ghz处理器与四颗ARM A53 2.0 Ghz处理器。相较于上一代产品P23与P30,CPU及GPU性能均提升70%。采用12nm FinFET制程工艺,功耗表现得到很大提升,整体效能提升12%,执行大型游戏时的功耗降低25%,大幅延长手机电池的使用时间。
关于AI配置,联发科在P60中引入了AI单元APU,在P60中采用了三核ISP+双核APU的架构,性能提升两倍。ISP+APU的多核图像处理单元除了提供硬件加速之外,还能够提供多线程的处理能力,这使得对于图片处理能力和速度大幅提升。包括自动对焦、白平衡以及高规格HDR在内等反映的速度更快。此外,APU的引入以及联发科提供的平台化的策略,也更有利于开放给合作伙伴以及第三方进行拍照的后处理,定制更多的拍照算法。应该说AI的引入,使得P60的硬件性能进一步得到释放。与此同时,AI所带来的软件层面的超级算力也将带来诸如人脸、语音识别等功能的进一步增强。
5、紫光展锐SC9863
紫光展锐SC9863主打AI牌,被称为8核AI芯片,支持CAT-7,采用Arm Cortex-A55处理器架构的SoC芯片平台,在Cortex-A55人工智能的基础上,进行了应用开发。Cortex-A75与Cortex-A55均采用Arm DynamlQ技术打造,而DynamlQ融入了AI神经网络技术。相比前代Cortex-A53,Cortex-A55 NEON进行了流水线改进与新增机器学习指令,让其在矩阵乘法运算方面的机器学习性能大幅提升,如果按照AI 8bit dot-product运算能力,比Cortex-A53提升6倍。
同时,得益于ARM DynamlQ单簇组合方式,Cortex-A75与Cortex-A55可实现1+3、1+7或者4个大核、8个小核的组合,多个CPU核芯以单簇的方式一起工作,可发挥更强大的性能,避免“1核有难,7核围观”的状况。紫光展锐SC9863采用的是8核Cortex-A55的组合方式,而高通骁龙845是4核Cortex-A75与4核Cortex-A55的组合方式。
SC9863芯片平台的AI能力体现在支持基于深度神经网络的人脸识别技术,可实现快速精准的人脸认证;通过智能AI算法,实现实时智能场景检测识别、不同场景智能拍照增强、支持手机侧图库照片的智能识别与分类。但是,没有加入独立的神经处理单元,计算能力是否会出现折扣不得而知。
6、瑞芯微RK3399
RK3399Pro采用big.LITTLE大小核CPU架构,双核Cortex-A72+四核Cortex-A53+四核ARM高端GPU Mali-T860,其集成的NPU(神经网络处理器)融合了Rockchip在机器视觉、语音处理、深度学习等领域的多年经验。相较传统芯片,典型深度神经网络Inception V3、ResNet34、VGG16等模型在RK3399Pro芯片上的运行效果表现出众。
RK3399Pro的AI特性有三点:
1)AI硬件性能高,采用专有AI硬件设计,NPU运算性能高达2.4TOPs,高性能与低功耗指标均大幅领先:相较同类NPU芯片性能领先150%;相较GPU作为AI运算单元的大型芯片方案,功耗不到其所需的1%;
2)平台兼容性,RK3399Pro的NPU支持8bit与16bit运算,能够兼容各类AI软件框架。现有AI接口支持OpenVX及TensorFlowLite/AndroidNN API,AI软件工具支持对Caffe/TensorFlow模型的导入及映射、优化;
3)完整方案易于开发,Rockchip基于RK3399Pro芯片提供一站式AI解决方案,包括硬件参考设计及软件SDK,可大幅提高全球开发者的AI产品研发速度,并极大缩短产品上市时间。
从以上六款带有AI功能的芯片来看,在架构上基本都是采用了多核模式,以八核为主;另外,关于AI运算,在原有CPU、GPU的基础上增加独立神经元计算处理单元成为主流趋势,这样可以实现AI运算加速,从而带来更好的用户体验;在应用方面,还是以手机的人脸识别、图像处理为主,未来随着5G的商用,在自动驾驶汽车中的应用也会逐渐增加。
从对比中可以看出,国产厂商和国内厂商各占一半,从高端到低端均有覆盖,在独立神经元计算单元的集成上,只有海思、苹果、联发科的产品上已经实现,其它几家厂商还在追赶。由于智能手机强烈的市场需求,因此AI普及起来更为顺畅,但是目前需要在人脸识别和图像处理的基础上探索更多可能的应用。