英伟达[向云端],野心纯粹竞争复杂

Ai芯天下
关注

前言:

随着ChatGPT的爆火,全球高科技公司纷纷涌入AI领域开展[军备竞赛]。

随之而来的,便是英伟达GPU需求量猛增、云服务[算力告急,英伟达也嗅到了商机。

作者 | 方文三

图片来源 |  网 络 

图片

英伟达与它的大客户开始了反向竞争

AWS、微软和谷歌均已开始研发或已完成自主研发AI芯片,部分企业甚至已进入销售阶段。

这些举措旨在降低对英伟达芯片的依赖程度。

传统数据中心以CPU为核心,侧重于通用计算能力。

然而,新一代的加速计算数据中心更加注重并行计算。

这就意味着它必须具备更大的内存、带宽,以及将所有加速计算单元紧密连接的能力。

黄仁勋将这个过程称为数据中心现代化,这是一个将持续十年的周期。

这个新周期的开启预示着整个数据中心的建构方式、软硬件协同乃至电源和散热结构都需重新设计。

这让所有的云服务提供商几乎重回起跑线,针对CPU设计的上一代的数据中心方案几乎完全无法照搬。

据中心正在向加速计算方向转化,而紧缺的算力则通过云供应,于是英伟达也在建设自己的云。

图片

增加“收税”服务,合作和竞争同时存在

在8月份的季度报告中,英伟达向投资者传达了一项重要信息:向开发AI或虚拟现实应用程序的公司销售软件代表着一个潜在的3000亿美元的收入来源。

去年,英伟达向亚马逊网络服务(AWS)和其他云服务供应商提出了一项不同寻常的建议:

英伟达希望向它们的数据中心租用由英伟达芯片驱动的服务器,然后把这些服务器转租给AI软件开发商。

换句话说,在向云服务巨头卖卡的同时,英伟达还想要利用其硬件端的强势地位,向这些云服务巨头们[收税]。

据一位知情人士透露,微软、谷歌和甲骨文已接受英伟达的提案,但亚马逊AWS并未采纳。

对英伟达而言,这似乎是一种与云服务供应商竞争客户的策略。

然而,众多云服务供应商长期以来一直是英伟达AI服务器芯片的主要购买者。

尽管英伟达可能是当前AI革命中的主要供应商,但其最大的云服务客户已开始生产自己的芯片,这种情况日益令人担忧。

这种情况可能意味着未来对英伟达芯片的需求可能会大幅下降。

英伟达的最大客户正在生产自己的芯片这一事实无疑对英伟达未来的销售增长构成了风险。

然而,英伟达已经在扩展以提供自己的云解决方案。

英伟达的高管意识到其最大的客户可能会成为其未来的竞争对手。

图片

不得不防的主动战略:进军云计算市场

英伟达在销售GPU方面加大力度,同时面临与重要客户竞争的局面,这种现象有三个关键原因。

①英伟达的GPU生产能力受到台积电的限制。

目前,英伟达的H100和A100芯片的全部制造过程都交由台积电负责。

由于ChatGPT等应用对GPU的需求暴增,英伟达已向台积电提出紧急增订GPU的订单。

然而,台积电的5纳米制程产能已经满载运行,英伟达的GPU订单被迫排至年底才能完成。

②微软、亚马逊、甲骨文、特斯拉等英伟达的重要客户纷纷自主研发AI芯片。

这些客户的离去可能会对英伟达的业务产生重大影响。

因此,英伟达需要趁目前业务状况良好的情况下,开拓新的业务领域,以防范潜在的风险。

③英特尔和AMD等竞争对手也一直在积极寻求机会,希望能够在GPU市场上抢占英伟达的份额。

图片

因此,英伟达需要采取适当的策略来维护自身的市场地位。

英伟达开始向云计算市场一步一步试探。

第一步,在今年3月21日的GTC大会上,英伟达发布了DGX Cloud。

它是一种AI超级计算服务,使企业能够立即访问为生成AI和其他突破性应用程序训练高级模型所需的基础设施和软件。

英伟达目前的做法是,将数据中心硬件出售给合作伙伴,然后再租回以运行DGX Cloud。

目前,英伟达DGX Cloud的客户已经包括了一些云服务的最大买家。

比如IT软件巨头ServiceNow、生物制药公司安进、保险公司CCC Intelligent Solutions。

对于传统的云服务提供商来说,DGX Cloud的崛起可能会让他们变成[中介]。

图片

第二步,投资三大云巨头的竞争对手。英伟达今年先后投资了CoreWeave、Lambda Labs两家美国的中小云服务商,并且向其倾斜分配稀缺的GPU芯片。

尽管才刚刚开始,但布局云业务代表了英伟达对于云巨头的反击。

这显然会冲击英伟达和云厂商的关系,最主要的云服务商谷歌、亚马逊和微软同样也是英伟达的大客户,英伟达推广自有云服务势必会抢夺它们的市场份额。

同样重要的是,云服务使英伟达能够销售用于管理开发AI模型的大数据集的软件,与Databricks、Snowflake以及微软的类似产品竞争。

图片

利用在AI硬件的主导地位,在云软件行业站住脚跟

英伟达致力于提供计算和软件基础设施,以便公司企业训练自己的AI模型,然后在DGX Cloud上的任何地方运行模型。

这样一来,公司不会受制于某家特定的云提供商,但完全受制于英伟达的硬件。

这样一来,除了直接接触客户外,英伟达还受益于DGX Cloud,因为更好的性能使其自家的硬件更具吸引力,从而确保其在AI硬件市场的主导地位。

DGX是英伟达在2017年首次发布的超级计算机,黄仁勋称之为[装进机箱里的数据中心]。

第一代DGX内部集成了8块GPU与4块固态硬盘,并使用了英伟达NVlink连接技术。

今天,DGX超级计算机已经发展到第五代,前四代分别为DGX P100、DGX A100、DGX H100,以及最新的DGX GH200。

英伟达发布的DGX Cloud,就是此前发布的超级计算机的云版本,一个DGX Cloud实例配置了8张A100或H100。

DGX Cloud直接利用了英伟达DGX超级计算机的能力,云的每个实例均配备8个H100或A100 GPU以及640GB内存。

DGX Cloud采用了一种低延迟结构,让庞大的工作流可以在集群之间扩展,于多个计算节点上并行分配。

图片

结尾:

凭借手上的A100、H100两张王牌——在很长的一段时间内,这两款芯片都是大模型训练与推理的最佳选择且没有之一,英伟达有机会成为云计算市场真正意义上的幕后操盘手。

一场围绕着芯片与云计算的明争与暗斗,正在这四家全球市值前五名的科技巨头中缓缓展开。

部分资料参考:品玩:《如日中天的英伟达,下一个目标是抢走云厂商的生意?》,甲子光年:《英伟达与云巨头必有一战》,硅发布:《英伟达 NVIDIA 进军云服务市场》

       原文标题 : AI芯天下丨分析丨英伟达[向云端],野心纯粹竞争复杂

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存