前言:
最近几年,随着系统中的CPU承受越来越多的网络和存储工作负载,DPU已成为以数据为中心的加速计算模型的第三个成员。
那么,DPU能否真正承担起与CPU、GPU一样的计算重要性,实现数据中心的一次巨大革新?其创新点到底在哪里?这些仍然是我们要去回顾和考察的问题。
DPU将成未来计算支柱之一
DPU,是Data Processing Unit的缩写,也就是所谓的数据处理单元。
DPU的主要作用就在于替代了数据中心原本用来处理分布式存储和网络通信的CPU处理器资源。
目前服务器要处理的资料日益增多,除了原有的加解密、封包压缩外,加速器也让服务器要处理的资料量变得更庞大,就会造成原有CPU在处理安全能力表现上出现瓶颈。
如果有了DPU的出现,就可以先在DPU将大量的信息先做消化,接着再传递给CPU做其他的分配,如此一来能减少CPU约30%的消耗。
在DPU之前,智能网卡(SmartNIC)正在网络安全和网络互连协议方面逐渐取代CPU。
而现在DPU的出现,相当于是智能网卡的升级替代版本。
一方面增强了智能网卡对网络安全和网络协议的处理能力;
一方面又整合和加强了分布式存储的处理能力。
从而在这两个领域更好地替代CPU,从而释放CPU的算力给到其他更多应用。
所有的这些DPU功能对于实现隔离的裸机云原生计算至关重要,它也将定义下一代云规模计算。
DPU走进巨头视线的原因
①DPU更安全,因为控制平面可以在系统内和系统集群之间与数据平面分离。DPU可以执行原本需要CPU处理的网络、存储和安全等任务。CPU的不少运算能力可以被释放出来,去执行广泛的企业应用。
②DPU释放了服务器的容量,以便它们可以恢复到应用程序计算。在一些具有大量I / O和沉重虚拟化的系统上内核成本缩减一半,因此吞吐量提高了2倍。
③DPU丰富的、灵活和可编程的加速引擎可减轻和改善AI和机器学习应用的性能。
④DPU能充当数据中心的“第三插槽”,补充CPU和GPU,同时在单位功率和空间内带来前所未有的好处。该公司还表示,这些好处是安全可靠的。
⑤高帧率、高动态范围显示,这些其实都需要顶级的DPU来实现。
⑥对于智能汽车来说,未来的超大屏当然也需要强力的DPU和VPU来支撑。
⑦DPU引入机器学习算法,可对数据进行智能管理、控制和分析,从而减少闪存擦写次数,延长SSD使用寿命;还可减少盘内计算和总线数据量,减轻主机CPU的负担。
英伟达最为看重DPU并发力
英伟达在DPU上的技术突破,来自于去年收购以色列芯片制造公司Mellanox之后,在这家公司的硬件基础上开发出BlueFeild系列的两款DPU——英伟达BlueField-2 DPU与BlueField-2X DPU。
BlueField-2 DPU具有英伟达Mellanox Connext-6 SmartNIC的所有特点,与8个64位的A72ARM处理器内核一起,实现可完全编程,并能提供每秒200千兆比特的数据传输速率,从而加速关键数据中心的安全、网络和存储任务。
最核心的一点是单个BlueField-2 DPU可以提供相当于消耗125个CPU内核所提供的数据中心服务,从而有效释放CPU内核的算力资源。
英伟达发力DPU建设的深层目的,一个是DPU试图再一次复制GPU替代显示加速卡成为通用显示芯片的路径,再一个是DOCA试图再一次复制CUDA在GPU通用化过程中所起到的开创生态之功。
国际巨头开始纷纷提前布局
根据THENEXTPLATFORM的分析指出,在2020年,SmartNIC正在演变成DPU,每个人都想在这个领域分一杯羹。
在这个领域的玩家或者潜在玩家主要包括Broadcom,英特尔,英伟达,Netronome,Pensando,Fungible和赛灵思,还包括云供应商三大巨头。
近水楼台先得月,Broadcom是商品以太网NIC控制器市场上无可争议的领导者。Broadcom的Stingray架构采用了单芯片方法,与其他竞争对手的许多芯片板相比,单芯片SmartNIC解决方案在板级生产的成本始终较低。
英特尔也对用于超大规模生产者和云构建者的可编程以太网交换和SmartNIC更感兴趣,在DPU上,英特尔主要是将CPU和FPGA结合在一起。
赛灵思是SmartNIC领域中另一位杰出的FPGA进入者,其Alveo U25将双SFP28端口直接连接到Zynq系列芯片,包括6GB DDR4内存,Zynq的FPGA和Arm内核可通过该芯片上运行的程序对其进行访问。
Fungible公司的DPU起到数据中心结构控制和网络层的作用,通过减少资源等待的次数和动态构成服务器的基础结构,来提高数据中心的效率。
其生产的DPU将网络资源总拥有成本降低到原来的四分之一,计算能力降低到原来的一半,存储降低到原来的五分之一以下,总成本降低到原来的三分之一。
除了上述供应商,全球的云厂商巨头也都在部署SmartNIC,而且三家云供应商正在设计自己的系统级芯片架构,他们就是阿里云的X-Dragon,亚马逊AWS的Nitro和微软Azure的Catapult。
结尾:
DPU可以和CPU、GPU相结合,构成完全可编程的单一AI计算单元,实现前所未有的安全性和算力支持。
CPU、GPU、DPU将代表未来计算的三大支柱。这三者之间,CPU用于通用计算,GPU用于加速计算,而DPU在数据中心周围移动数据,进行数据处理。