全新的Cortex-A76
麒麟980在规格上最大的亮点就是采用7nm工艺,集成了69亿个晶体管。据TSMC的官方统计,相比上一代旗舰——10nm工艺制程的麒麟970,980性能提升约20%,能效提升约40%,逻辑电路密度提升60%,即原来的1.6倍。众所周知,传统芯片遵循摩尔定律,以提升单位面积内晶体管的数量,来提升芯片的性能。我们已经知道,决定一款处理器性能最核心的因素主要是工艺、架构等方面。而工艺越先进,则意味这处理器的精细度越高,可以集成更多的晶体管。更重要的是,更精细的制造工艺,还能够尽可能的缩小元器件之间的距离,减小功耗。尤其是对于现在智能手机的架构,越来越“暴力”的架构对工艺更加依赖。而目前芯片制造工艺普遍停留在10nm,7nm工艺则一度被称为”最逼近硅基半导体工艺的物理极限”,因此,这次麒麟980首发的7nm工艺则体现了麒麟在工艺上的进步。
在CPU方面,麒麟980基于ARM Cortex-A76 CPU架构。性能方面,根据ARM官方的说法,Cortex A76在最新7nm工艺下,运行频率能将达到3GHz,相比上一代麒麟970所用的A73,整数性能提升了90%,浮点性能提升了150%,综合性能提升80%。尽管这样的对比并非在同工艺同频的状态下对比,并不能完全体现新架构的性能。因此我们还要看应用到芯片当中的实际数据。在麒麟980的发布会上,华为官方给出的数据则称,相比于上代麒麟970提升75%,而能耗上则提升58%。这也是考虑到麒麟980的最高主频为2.6GHz,所带来功耗与发热之间的平衡。对比ARM官方的参考数据,倒也比较靠谱。
这套全新设计的A76 CPU架构,由2个超大核、2个大核和4个小核的三档能效架构组成,采用DynamIQ调度技术。相比于Big.little,DyanmIQ重新定义了多核微架构,而DynamIQ最大的特点就在于DynamIQ 丛集的一个丛集中Cortex-A CPU数量可以从单核到8核不等,并且还支持异构CPU之间的混搭。因此,此次麒麟980在调度方面,针对于不同的使用场景,能够把不同核心之间进行灵活调度,执行效率更高。
低调的Cortex-A55
在能效核心方面,麒麟980选择了A55。提到A55,就不得不提它的前辈A53,这个12年发布的大名鼎鼎的架构直到现在还在统治着中低端处理器。出色的能耗比以及强大的扩展性,使得A53几乎被应用在绝大多数的中低端处理器上。而A55,则是A53的提升版。
Cortex-A55采用最新的ARMv8.2架构,根据ARM官方给出的数据,在相同的频率与工艺条件下,内存性能最高可达Cortex-A53的两倍,而在相同的频率与工艺条件下,效能比Cortex-A53高15%。值得一提的是,ARM为A55设计了一个二级高速缓存,对于每一个核心都是专用内存,与 Cortex-A53 相比,二级高速缓存的存取时间缩短了 50% 以上。而且二级高速缓存的工作频率设计成与 CPU 相同的频率。通过降低延迟大幅提升 CPU 在各类基准测试工具中的性能。
另外,ARM对A55还推出了三级高速缓存,可供集群内的所有 Cortex-A55 CPU 共享。尤其是对于DynamIQ集群之下的核心,能够得益于 CPU 附近增多的内存容量,从而提升性能、降低系统功率。相比A53,在同等性能的情况下,Cortex-A55能够节省的功耗比A53提升了30%。这对于中低端处理器是非常重要的。
全新的G76,能帮助麒麟翻身吗
麒麟980采用Mali-G76 MP10,主频为720MHz,相比于上一代,Mali-G76的提高单位功耗性能和单位面积性能,性能密度相较于前代Mali-G72提高了30%,架构效率提升了30%,机器学习处理能力提高了2.7倍。事实上,相比于高通的Adreno的面前,Mali在单核心性能上一直都是弟弟。因此Mali系列在推出时,你经常可以看到什么MP20、MP32之类“很吓人”的数字。但问题是作为一个体积基本固定的手机,是不可能无限堆叠核心,因此Mali在Adreno面前一直都略显孱弱。
观其历史,通过参数对比我们可以看到,采用Mali的两家,三星采用的策略是低频多核心的方案,例如Exynos 9810,堆了18颗核心,但主频只有546MHz,而麒麟则是高频低核的策略,之前的麒麟970 MP12主频为746MHz。因此在G76中,ARM将Mali最大的可采用核心降到20个,以提升能量密度。这也是比较符合目前整个移动SoC的大趋势。
Mali G76采用最新基于Bifrost的架构,与之前midgrad架构相比,Bifrost最大的创新在于使用指令组着色器(ClausedShader),另外Bifrost架构还采用Quad based vectorization技术,相比于之前SIMD矢量化技术一次只能执行单一线程,Quad矢量化技术最高支持四线程执行,共享控制逻辑,使用率接近100%。相比于G72,G76性能密度提升了30%、能效提高20%。
在功耗方面,我们引用anandtech采用GFXBench Manhattan 3.1离屏的能效数据,可以看到,在7nm工艺下,G76 MP12的平均功率表现不错,只有4.08W,甚至比S9+的5.01W还低一些,而相比于上一代的麒麟970的6.33W有了很大的提升。而在效率上,更是进步非常明显(注意,这里指的是能耗,而非绝对性能)。
理论上,此次麒麟980拥有不错的性能。如果说最强大的一代麒麟芯片还有点“废话”的嫌疑,我们可以说,这是麒麟980立足旗舰级SoC最无可争议的一次。
我们还记得,在今年年中的时候,华为发布了很吓人技术“GPU Turbo”,而在Mate 20 Pro中,华为带来升级版的GPU Turbo 2.0。华为通过对high network骨干网的优化,实现了单端多径,聚合加速,WIFI环境下系统会智能选择延时更短的通路用于用户玩游戏,达到网络延时优化。另外,得益于麒麟980的双核NPU,Mate 20 Pro实现了更精准的AI动态识别。对游戏场景下的功耗、负载等行为进行智能学习,建立更准确的SoC能效模型,优化资源调配,作出更准确的负载预测。
在实际游戏表现上,我们用Mate 20 Pro分别进行了《QQ飞车》、《崩坏3》的测试。
可以看到,对于《QQ飞车》这样场景不停变换的游戏,需要GPU实时渲染,对于手机的图形性能有一定的考验。而整个游戏体验下来,除了游戏过程中60Fps(满帧)的成绩之外,Mate 20 Pro对于触控的优化改善比较明显。基于麒麟980的AI触控智能调度得到显著的应用,对于左右漂移、各种按键组合操作相应都比较积极,整个游戏体验非常不错。
而在性能方面,我们采用《崩坏3》来对手机性能进行测试。(由于游戏代理商的限制,我们只能在比较初级的关卡操作)。
可以看到,整个游戏过程都比较流畅,除了关卡之间正常掉帧之外,战斗时帧率几乎没有波动,比较稳定。