芝能智芯出品
PCI-Express(PCIe)技术作为服务器内部组件与外部设备互连的核心,其带宽每三年翻倍的规律推动了计算性能的持续提升。从首次技术讨论到实际应用的三年滞后期,使得业界对PCIe 6.0的期待尤为迫切。
博通通过2014年收购PLX Technology进入PCIe交换机市场,凭借Atlas系列交换机和Vantage系列重定时器,巩固了其在PCIe 6.0时代的领导地位。
与此同时,Nvidia的NVSwitch架构以高带宽、低延迟的专有解决方案在AI服务器中占据优势,但其高成本和封闭性限制了普及。
PCIe 6.0引入PAM-4编码和前向纠错(FEC)机制以提升带宽,却面临信号完整性和延迟的挑战。
文章分析了PCIe 6.0的技术细节、市场驱动因素以及博通的竞争策略,并提出了一种开放的PCIe端口聚合方案,旨在平衡成本与性能,推动高性能计算(HPC)和AI应用的广泛发展。
Part 1
PCIe 6.0
的技术挑战与市场驱动
PCIe 6.0标志着该技术的一次重大突破,其核心变化是从PCIe 5.0的NRZ(不归零)编码转向PAM-4(四级脉冲幅度调制)编码。
NRZ编码每个信号周期传输1位数据,而PAM-4通过四级幅度实现每周期2位传输,使带宽从PCIe 5.0的32 Gb/s翻倍至64 Gb/s。然而,PAM-4信号复杂度更高,其误码率(BER)较NRZ高出三个数量级,对信号完整性构成严峻挑战。
为确保数据可靠性,PCIe 6.0引入了前向纠错(FEC)机制。FEC通过在数据包中添加冗余信息纠正错误,但计算纠错码的过程增加了系统延迟,这对延迟敏感的AI和HPC应用尤为不利。
为此,PCI-SIG(PCIe标准制定组织)采用了流控制单元(FLIT)和循环冗余校验(CRC)的混合机制。
测试显示,该设计在小数据包传输中略增延迟,但在大数据包传输中将延迟减半,整体优化了性能。例如,PCIe 6.0 x16通道的双工带宽达256 GB/s,足以应对高吞吐量场景,但延迟优化仍是技术推广的关键。
PCIe 6.0在铜线传输上面临信号衰减问题。随着带宽提升,铜线上的噪声加剧,传输距离被迫缩短。博通的Vantage 5重定时器通过增强信号强度,将传输距离恢复至较低带宽下的水平,成为PCIe 6.0生态系统中不可或缺的组件。
AI和HPC应用的爆炸式增长推动了对高带宽、低延迟互连的需求。
在AI服务器中,多GPU之间的高速通信和数据共享对带宽要求极高,而传统PCIe架构在连接GPU、加速器和网络接口时常遭遇瓶颈。例如,一台配备8个GPU的AI服务器通常需要4个PCIe交换机,每个交换机支持数十个通道,以实现设备间的点对点通信。
Nvidia的NVSwitch架构通过专有设计满足了这一需求。NVSwitch 4 ASIC提供57.6 Tb/s总带宽,每个NVLink 5端口达1.8 TB/s,远超PCIe 6.0 x16的256 GB/s。
然而,NVSwitch的高成本和专有性使其局限于Nvidia生态系统,难以普及。相比之下,PCIe 6.0作为开放标准,具备更广泛的兼容性和成本优势,成为业界关注的焦点。
博通抓住这一机遇,其Atlas 3交换机支持144个通道(72个端口),通道数比竞争对手多2.25倍,显著提升了AI服务器的互连能力,Vantage 5重定时器通过支持PCIe 5.0和6.0的双模编码,进一步增强了信号传输的灵活性,满足了市场对高性能互连的迫切需求。
Part 2
PCIe 6.0交换机
与NVSwitch的竞争及未来方向
PCIe 6.0交换机和NVSwitch代表了两种不同的技术路径。
NVSwitch通过聚合NVLink端口,实现GPU间的直接高带宽通信,其1.8 TB/s的单端口带宽在AI训练和推理中表现出色。
然而,这种性能依赖于Nvidia的专有生态,成本高昂且兼容性有限。例如,NVSwitch 4需要72条200 Gb/s通道构成一个端口,总计仅4个端口,限制了其扩展性。
PCIe 6.0交换机以开放标准为基础,单通道速率达64 Gb/s,x16配置提供256 GB/s双工带宽。虽然单端口带宽不及NVSwitch,但通过多通道聚合和交换机设计,PCIe 6.0可支持更灵活的系统架构。
博通的Atlas 3交换机以144个通道领先市场,能够连接更多设备,适用于通用服务器和HPC集群。此外,PCIe 6.0的成本远低于NVSwitch,使其在非AI场景中更具竞争力。
为弥合PCIe 6.0与NVSwitch的性能差距,业界提出了一种开放的PCIe端口聚合方案,类似于Nvidia的NVLink。例如,聚合64个PCIe 6.0通道(x64)可实现1 TB/s的带宽,接近NVLink 5的1.8 TB/s,同时保留16个通道用于其他用途。
这种“PCI-Link”端口不仅提升带宽,还可结合CXL协议实现内存一致性,支持更复杂的系统设计。
● 方案的优势包括:
◎ 开放性:基于PCIe标准,兼容现有硬件和软件生态。
◎ 成本效益:无需专有ASIC,制造和部署成本更低。
◎ 可扩展性:支持多种设备互连,适应AI、HPC和数据中心需求。
与NVSwitch相比,PCI-Link的带宽稍逊,但其开放性和低成本使其更具市场潜力。例如,一个144通道的Atlas 3交换机可配置多个x64端口,提供数TB/s的总带宽,足以应对AI工作负载。
PCIe 6.0的商用化进程正在加速。博通的互操作开发平台(包括Atlas 3和Vantage 5)已于2024年推出,预计2025年将有更多AI服务器采用PCIe 6.0设备。
博通产品线经理Sreeni Bagalkote表示,PCIe 6.0的过渡将首先在测试设备中展开,随后进入制造阶段,真正的AI服务器部署将在明年逐步增加。
● PCIe端口聚合方案的实现面临多重挑战。
◎ 首先,硬件设计需支持更大规模的通道聚合,可能增加交换机复杂度。
◎ 其次,协议优化需进一步降低延迟,以匹敌NVSwitch的性能。
◎ 最后,生态系统建设需要英特尔、AMD等厂商的协作,推动标准统一和市场接受度。
小结
PCIe 6.0的推出是互连技术的重要里程碑,其高带宽和优化延迟特性为AI和HPC服务器提供了强有力的支持。博通通过收购PLX Technology和持续创新,凭借Atlas 3和Vantage 5等产品在PCIe交换机市场占据领先地位。
尽管Nvidia的NVSwitch在性能上独树一帜,但其专有性和高成本限制了广泛应用,而PCIe 6.0凭借开放性和成本优势展现出更大潜力。
未来,通过PCIe端口聚合等开放方案,业界有望在性能和成本之间找到平衡,推动高性能计算技术的普及。
原文标题 : PCIe 6.0技术:博通在AI领域的抓手