美国加速打出“芯片牌”。
当地时间10月7日,美国商务部又宣布了对芯片实施新的出口管制,其中明确提到对中国发展超级计算机的限制:将先进计算芯片添加到商业控制清单(CCL),该类项目对华出口需要许可审批,并将出口管理条例(EAR)的范围,扩大到部分在外国生产的先进计算机的相关产品。
这一指令并不突然。
Δ 美国实施芯片新的出口管制
美国此前已经要求英伟达暂停向大陆出货A100、H100 GPU卡,要求AMD暂停出货的MI200 GPU。并且,以A100为基准,后续峰值算力和芯片间I/O性能均等于或大于A100的其他芯片,以及包括这些芯片的任何系统都将受到出口管制。除非获得美国商务部的出口许可证。
此后虽给予的一定的缓冲时间。但伴随着此次出口管制的发布,进一步明确了美国对于中国芯片,乃至背后科技产业的限制在不断加大。
中长期来看,国内半导体自主可控的方向不会改变,上述限制有望进一步倒逼中国半导体产业加速自主化进程。
01
限令之下,英伟达如何应对?
时间回溯至8月底。
8月31日,英伟达发布公告称:8月26日,美国政府对英伟达未来出口到中国(包括香港)和俄罗斯的A100和即将推出的H100芯片实施了新的许可证要求,该许可立即生效。新的许可证要求将解决涉及的产品可能用于或转移到中国和俄罗斯的“军事最终用途”或“军事最终用户”的风险。
上述许可涉及到的芯片主要包括:英伟达A100和即将出货的H100两款芯片、基于A100/H100打造的DGX产品、以及未来实现峰值性能和芯片对芯片I/O性能均等于或大于大致相当于A100的阈值的任何英伟达芯片。目前来看,美国政府对中国以及俄罗斯出口限制的主要是针对数据中心的高端独立GPU芯片及相关产品。
Δ 英伟达/AMD高端GPU芯片性能参数。资料来源:富途证券
8月24日,英伟达曾表示,预计FY2023Q3(对应CY2022年8月-CY2022年10月)营业收入预计为59亿美元,受此次出口管制影响,中国地区的潜在营收损失约4亿美元。
不过,仅一天后,9月1日,英伟达又发布公告称,公司已美国政府新的授权审批,具体内容包括:
“美国政府已批准英伟达继续开发H100芯片所需要的出口、在出口和国内转移。
允许英伟达在2023年3月1日前,为A100的美国客户提供所需的出口支持。目前,公司A100的美国客户包括戴尔、思科等服务器设备厂商,以及终端客户亚马逊、谷歌等。
美国政府授权A100和H100,在2023年9月1日之前通过英伟达在中国香港的工厂履行订单和物流。”
而据TAIPEI TIMES《台北时报》报道,美国政府放宽许可授权的主要原因是,A100的部分开发工作是依赖中国工程师和中国运营部门进行。若A100无法完成开发,对英伟达的业绩影响相对较大。
可以理解为,短期内,英伟达A100和H100可以继续出口中国,但长期是否可以售卖给中国客户仍需看能否获得美国政府的持续许可。
Δ 英伟达单芯片推理性能(Int8 Tops)。数据来源:英伟达、中信证券
在此之下,据台媒报道,英伟达对台积电下超级急件(super hot runs)订单,提前生产原订2023年出货的部分产品,总量约5000片,最快今年10月底至11月初开始交货,相关急件交期将大幅缩短,从原本预估的5~6个月,压缩为2~3个月。
与此同时,有业内人士称,一旦明年美国的缓冲期过后,若英伟达不能再出口H100与A100,后续估计将转为出售较低阶的产品。因此,在美国限制A100和H100 GPU产品销往大陆的缓冲期之内,英伟达希望完成更多的交付。
行业人士表示,根据最新消息,英伟达如果真的确定对中国断供A100,其会推出一款中国特供版,即把单片性能压缩到1600T以内,去保证持续供货。“当然这只是妥协的办法,我们不是说没得用,可能性能上会打折扣。”
事情都有两面性。上述人士认为,特斯拉一直以来传达的很重要的点在于,软件算法空间是很大的,可能暂时性硬件受挫会让软件算法往前迈一大步。
“另外这也是一个机会,也许我们会面临短暂的困难,但终究会解决的。”据行业人士称,数据中心对于现阶段人工智能算法来说是必要的,我们有持续提升数据中心能力的诉求,所以我觉得还是得指望中国本土企业,有着基础知识产权能力的企业,快速帮助中国需求方补充算力能力。
02
短期来看,对自动驾驶冲击较小
英伟达的A100和H100以及AMD的MI250,都是目前世界上商用领域里最为顶尖的GPU芯片产品。
GPU(图形处理器)主要应用于图显和计算两大方面,与知名度更高的 CPU(中央处理器)相比,更适用于密集型数据处理。此次英伟达受限芯片主要用于AI、HPC、自动驾驶等领域,属于GPGPU(General Purpose GPU,通用计算图形处理器),而其他GPU不受影响。
其中,A100是英伟达于2020年5月14日发布、基于Ampere架构的加速计算卡,采用台积电7nm工艺,拥有540亿个晶体管,GPU最大功率400W,搭载厂商包括华硕、Atos、思科、Dell、富士通、HPE、浪潮、联想,以及阿里巴巴、百度、腾讯、京东等。下游主要应用于人工智能、数据分析等领域。
Δ 英伟达H100
英伟达H100于2022年3月22日GTC技术大会中发布,搭载Hopper架构,拥有18432个CUDA内核,核心频率1.8GHz,采用台积电4nm工艺。H100的FP16(峰值半精度)、TF32(峰值单精度)以及FP64(峰值双精度)算力为A100的3倍,分别为2000 TFLOPS、1000 TFLOPS和60 TFLOPS。
此外,H100还增加了对FP8的支持,算力达到4000 TFLOPS,为A100芯片的6倍,可用于大型 AI 学习以及云计算中心。
短期来看,一旦A100等芯片受限,对我国数据中心建设影响比较大。即,将影响国内阿里云、腾讯云等云厂商高端数据中心的建设。
国内云厂商可以使用性能更低的替代产品,并靠堆数量的方法获得同等规模算力,但这将增加计算成本,同时一些高精度计算也会受限。
有行业人士举例称,AI芯片是一个集群,一个数据中心可能需要几万片AI芯片,高性能芯片如果需要5000片,那么性能更低的产品可能需要2万片。这个做法尽管理论可行,却会带来更高的计算成本。
而自动驾驶领域短期冲击较小。
此次供应受限的A100和H100等芯片在自动驾驶中主要用于数据中心场景中的云端训练,而用于终端的英伟达Xavier、Orin等车载芯片则未受到限制。
因此,尽管A100也应用于自动驾驶训练中,比如特斯拉最新的超级计算机使用超过7000枚 A100 GPU进行自动驾驶训练;我国部分车企也基于英伟达A100打造了自动驾驶训练中心,比如2021年底蔚来宣布采用英伟达A100打造超级计算机,用于自动驾驶训练。
Δ 小鹏汽车与阿里云宣布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练
但由于AI训练芯片不会随着终端销售规模的增加而快速消耗,短期来看存货足够则可以满足几年内的扩容。比如小鹏汽车董事长认为公司目前存货可以满足未来几年的需求。
今年8月2日,小鹏汽车联合阿里云,宣布在内蒙古乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。尽管小鹏没有公布“扶摇”数据中心的AI芯片选型,不过极大可能是英伟达A100。
因此长期来看,若英伟达高端GPU芯片限制持续升级,而我国高端芯片持续缺乏,则自动驾驶的云端训练效率将受到影响,从而影响我国自动驾驶产业发展。
03
代差明显,国产替代迎落地机遇
重压之下,寻求国产替代不断被提上日程。但显然这并不是一件容易的事。
作为GPU的发明者,英伟达在该领域的地位是毋庸置疑的。从技术领域来看,相较于全球其他主要竞争对手,英伟达在产品完整度、存量市场份额等层面实现领先,且领先优势大概率会维持很长时间;从软件生态布局来看,英伟达的CUDA(NVIDIA推出的运算平台)生态具有较高的壁垒,用户迁移需要较高的成本。
双“BUFF”加持之下,英伟达GPU在AI训练、高性能计算领域长期占据主导地位。根据市场情报公司Liftr Insights数据,2021年一季度,在全球TOP云厂商数据中心AI加速芯片市场,英伟达份额占比为78%。且近年来其基本稳定在80%左右,市场领先地位稳固。
Δ 全球数据中心芯片市场营收规模(百万美元)。数据来源:Bloomberg、中信证券
尽管有差距,但可以看到的是,近年来国内GPU厂商也在不断涌现。从2014年至今,国内多个GPU芯片相关企业成立,其创始人团队多有在英伟达、AMD 等企业有多年的工作经验,并且取得了一定的成果。
从产品角度来看,国产高端AI芯片在某一些维度已经接近或者超过英伟达。比如壁仞科技的壁砺100芯片采用7nm先进制程工艺,可提供的峰值计算能力为2048TOPS@INT8,超过了A100的624 TOPS@INT8。
不过,通用性上,他们与英伟达相比仍有一定差距。整体来看,国内GPU厂商在半精度&单精度领域中的计算能力,约落后英伟达、AMD1~2代左右;在双精度(64 位)计算领域能力近乎空白,而双精度运算更多应用于复杂科学计算。
Δ 中国与海外GPU厂商产品参数对比。数据来源:中信证券
原本,正如后摩智能创始人吴强在接受采访时表示,要替代英伟达,起码要比英伟达的产品性能好5~10倍,1~2倍的改良客户可以就等下一代产品,没必要忍受一个新的、没那么顺手好用的软件。
但伴随着美国对芯片管制的加强,国产GPU厂商迎来了机遇。中国企业需要做的是沉下心来,在技术、产品商业化落地等方面不断努力。
一方面,加大核心技术人才招募。一个顶尖人才加入,对于企业加成是巨大的。以AMD为例,2012年左右,伴随着硅谷传奇芯片架构设计师Jim Keller的回归,研究了基于x86-64与ARM微体系结构的Zen架构,大幅提升其在数据中心领域的竞争力。
另一方面,加速产品从设计到量产交付全流程跑通。禁令之下,会倒逼国内一些客户开始使用国产GPU产品,在一定程度上能够帮助相关企业与客户建立密切联系,进而帮助相关企业进行快速的技术和产品迭代。
有观点认为,车端,地平线是英伟达平替。而谁,会成为英伟达在“云端的平替”?
参考文献:
富途证券《从英伟达财报视角,观察全球半导体行业周期》
中信证券《美禁止英伟达和AMD对华出售高端GPU,或加速GPGPU国产化进程》
光大证券《美国限制高端 GPU 出口中国,催化国产芯片研发进程》
原文标题 : 英伟达A100倒计时:自动驾驶短期冲击不大,国产云端芯片迎来机遇