【AI前沿】一经发布震惊全球,看华为如何实力“碾压”高通与苹果!

其他 AI 手机方案竞争者

即将引入硬件 NPU 的高通

作为全球最大的手机方案供应商,高通过去通过 Hexagon 与 GPU、CPU 协同工作,达成对主流AI 框架的计算加速能力,虽然在效率上还是明显落后苹果与华为的硬件方案,但总是给市场一个交代。

然而,异构计算(Heterogeneous computing)虽然弹性高,且可以有效利用芯片中的不同类型计算架构,但目前 AI 计算方案讲求的是更高的能效表现,而在手机等移动终端上,更显重要,虽然高通的异构计算已经属于相当高效的技术,但仍与 ASIC 有一定的落差,也因此,在使用针对 AI 加速框架进行性能的评比应用时,高通很明显要落后采用硬件 NPU 的竞争对手,未来如果 AI 模型往更复杂的方向发展,或者是同时需要执行多种 AI 服务,那么在发展空间上就可能会明显不如竞争对手了。

(来源:高通官网)

不过,高通也不是不知应变,根据市场传闻,其在下一代中高端方案骁龙 700 系列中,将引入硬件 NPU 设计,而如果成真,其下一代高端方案,也就是骁龙 855,也将可能沿用同样的方式。

而目前高通也引进了包含商汤等多家 AI 算法设计公司所设计出来的应用框架,想要快速冲刺相关市场,不过高通目前的 AI 性能还有相当大的改善空间,如果要负载更复杂、多元的 AI 计算,恐怕还是要等到下一世代的 AI 设计问世。而根据 DT 君得到的信息,高通将在 12 月正式发布新一代的高端 AI 手机方案,按照往例,明年初就可以见到实际终端产品。

三星从抄袭到走出自己的路,Exynos的半软半硬 AI 亦然

三星作为全球最大的手机厂商,其势力涵盖终端、消费、云端服务、半导体制造与设计等领域,而其中,手机市场是其最重视的一块,而为了推动其手机市场的布局,三星过去亦步亦趋的追随包含苹果与高通的步伐,并将学习到的设计精髓转化为自有的方案设计。

目前三星主要的芯片来源包含了自行设计的 Exynos 系列、高通的骁龙系列、联发科的低端 MT 系列,以及展讯的 SC 系列,市场从最高端,到最低等级,可能会被我们直接当作电子垃圾的产品,几乎都有覆盖。

目前 Exynos 9810 是三星的主力自产高端产品,今年的 Galaxy S9 系列、Note9 系列都可见到其身影,其采用的 AI 计算方式与高通类似,主要是通过 DSP、GPU 与 CPU 的协同计算,不过三星有个特殊的作法,那就是视觉相关的处理交由硬件,而非异构计算。

目前的 9810 采用脱胎自 Cortex-A75 的 M3 定制架构,并搭配 Cortex-A55 作为小核心,而与华为最大的不同是,三星在 GPU 规模上相当舍得下工本,其 Mali-G72 核心数量配置高达 18 个,比麒麟 970 多出 6 个,虽然芯片成本会较高,但可以在较低的时钟水频达到更稳定、更好的效能表现,换言之,能效也更好。

(来源:三星官网)

而 9810 中有个 VPU 计算单元,顾名思义,是用来处理视觉方面的计算工作,这个单元应该是硬件设计,但只能用来处理比较固定的功能,三星也未公开发布任何支持该计算单元的可编程或开发套件框架。

而其他的 AI 计算工作就如高通般,是使用异构计算,统 GPU 与 CPU 来达成,这方面可能主要是沿用 Arm 的软件资源,三星也同样没有发布任何相关的开发套件给第三方开发者。

而下一代方案,也就是 Exynos 9820,将会采用 ARM DynamIQ 架构设计,并且将以“2+2+4”三丛集形式打造,其中两组大核将采用三星第四代自主架构“M4”,第二道两组大核则以 ARM Cortex-A75 构成 (也可能以 Cortex-A76 取代),而小核部分则将以 4 组 ARM Cortex-A55 构成。

AI 部分则将可能维持 9810 的作法,那就是采用 VPU 硬件处理单元来处理部分视觉计算工作,并搭配既有的异构计算方式来处理标准 AI 计算框架,也就是半软半硬的方式。

最后,9810 采用的是三星 10nm工艺,而 9820 将可能是三星 7nm 方案首发,但因为三星的 7nm 采用 EUV 技术,目前还在调试中,真正量产最快也要今年底或明年初,这也可能让 9820 成为最晚推出的次世代 AI 手机芯片方案。

赚走最多钱的手机公司搞 AI——苹果

苹果基本的手机芯片布局是每年一款,当然,为了配合如平板电脑或者是手表等其他终端的产品时程,也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的 A11 Bionic,内建的硬件 NPU 是最大特色。而苹果在其芯片中往往都使用较少的核心,相较对手都已经走到 8 核以上,苹果 A11 还只是个 6核产品,但其表现出来的性能数据却远远超越所有竞争对手,其原因包括苹果对其使用的 Arm 架构深度定制化,并舍得为了特定性能目的来堆加更多晶体管,因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售,并创造更高的获利,因此每一代方案苹果也就更舍得堆料,形成正向发展。

(来源:苹果官网)

A11 使用的是台积电 10nm 工艺,这也是少数几次没有使用到三星代工工艺的苹果芯片,由于目前苹果的开发套件中,只开放 GPU 计算能力给开发者,而 GPU 也负担包括第三方 AI 应用的训练或推理的工作,对苹果而言,GPU 的份量也越来越重要,这也是之所以苹果要推动自有 GPU 架构的发展。

虽然目前所采用的 PowerVR 架构在性能与菜单现上相当出色,该公司也愿意配合苹果进行高度定制工作,但这对于苹果而言仍远远不足,而展望未来苹果对其 GPU 架构的布局,将可能是个结合绘图、计算以及推理、训练的全功能 AI 优化设计,当然,为了能耗表现,推理工作可能还是维持独立的 NPU 单元来进行。

而未来 A12 将会如何?其实在现阶段也只能猜测,唯一能确定的只有使用 7nm 制造工艺这点。而在架构方面,根据过去的惯例,性能的增长肯定是不能忽略的,毕竟对手也都在积极追赶,今年对手的主流方案都已经在整体性能上有相当大的改善,也拉近了与 A11 的距离,A12 肯定会在CPU 与 GPU 方面进行更深度的改造,不论是增加更多的处理管线,更优化 CPU 或 GPU 内部的流水线设计,亦或者粗暴的堆加核心,都是可能的作法。

至于在关键的 AI 硬件单元方面,除了强化效率以外,也可能就规模方面进行扩展,借以压制华为或高通等即将面世的下一代 AI 方案。

专注中低端的联发科

联发科 2018 年主打的 AI 手机方案 P60,具备 AI 专用计算模块的APU(AI specialized Processing Unit),基于 DSP 计算架构,而 CPU 则是采用Cortex-A73 搭配 Cortex-A53 的四大四小设计,虽然不是采用最新的 Cortex-A76,但性能表现仍有一定水准,GPU 方案则是使用 Mali-G72 这款相当稳定的 GPU 架构,不过可惜的是,联发科为了成本考虑,只采用 MP3 配置,并以高频率运作来补足性能表现,因此在运行游戏时,可能会对电池寿命产生负面影响。目前 P60 已经被应用在包含 OPPO 等多款手机产品当中,虽后的小改版产品也已经箭在弦上。

(来源:联发科官网)

目前,中国前几大手机厂商都是联发科的客户,产品多分布在中低端,包含华为、OPPO、VIVO、小米、魅族,以及其他二三线厂商,基本上都摆脱不了联发科,毕竟中低端手机中具备成本优势,产品线完整且技术更新还能跟上市场脚步,且能提供最好技术支持服务的,就属联发科了。而在前两年,联发科也打入三星的供应炼,通过使用一定比重的三星芯片代工工艺服务,三星也在其低端手机中采用联发科的方案作为交换。

联发科的方案成本相对较低,且过去在包裹 TurnKey 服务方面口碑极好,在中国的支持人力也最广泛,虽然是 AI 生态的后进者,但是在商汤等 AI 大公司的协助之下,或许第一时间就能够提出够成熟的语音与视觉 AI 方案,对客户而言,联发科一直都是便宜又大碗的选择。

对于HUAWEI Mate 20系列将会搭载980芯片你怎么看?又讲会给广大用户带来怎样的性能体验呢?

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存