近些年,以CPU和GPU为代表的处理器在应用需求的推动下,相关的设计、制造和封装等技术都在发展变化当中。封装方面,虽然当下的3D技术很热,但对于绝大多数处理器来说,2D和2.5D封装技术仍是主流,而传统的MCM(Multi-Chip-Module,多芯片模块)焕发了第二春,各大CPU和GPU厂商都在大规模部署采用这种封装技术的产品。
MCM是一种由两个及以上Die,或者芯片尺寸封装(CSP)的IC组装在一个基板上的模块,形成一个电子系统或子系统,基板可以是PCB、陶瓷或硅片。整个MCM可以封装在基板上,也可以封装在封装体内。MCM可以是便于安装在电路板上的标准化封装,也可以是一个具备电子功能的模块,它们都可直接安装到电子系统中(PC、仪器、机械设备等)。
MCM可分为以下三种基本类型:
MCM-L:是采用片状多层基板的MCM,MCM-L是高密度封装的PCB技术,适用于采用键合和FC工艺的MCM。MCM-L不适用于有长期可靠性要求和使用环境温差大的场合。
MCM-C:是采用多层陶瓷基板的MCM,适于模拟电路、数字电路、混合电路、微波器件等多种应用。
MCM-D:是采用薄膜技术的MCM,MCM-D的基板由多层介质、金属层和基材组成。介质层要求薄,金属互连要细小,同时具备适当的互连阻抗。
MCM封装的优点可以概括为以下三点:1、可大幅提高电路连线密度,提升封装效率;2、可完成“轻、薄、短、小”的封装设计;3、可提升封装的可靠性。
近些年,SiP封装技术深入产业人心,那么,MCM与它相比如何呢?实际上,芯片封装技术的发展是不断进步和创新的过程,是对原有技术的整理、迭代、创新和再发展,MCM和SiP也是如此。MCM是在各种高密度多层基板上封装,主体是Die,制成部件的电路一般较为复杂,因此,MCM是一种高级混合集成技术。SIP的市场规模和增长空间比MCM大,SIP是MCM进一步发展的产物,是芯片和元器件在不同工作频段的高密度组装和互连。MCM主要通过将各种Die堆叠连接,元器件较少,通常以数字芯片、存储器为主,而SIP可封装不同制程工艺、不同功能的芯片,芯片之间可进行信号的存取和交换,从而实现一个系统目标产品的全部互连、功能和性能。
可见,相对而言,SiP比MCM先进,但这并不影响后者被越来越多的CPU和GPU厂商采用。因此,成熟的技术并不一定不如先进技术,这与近些年成熟制程节点技术火爆,产能供不应求的局面有异曲同工之妙。
MCM CPU大行其道
对于CPU而言,MCM并不是新技术,早在1995年,英特尔推出Pentium Pro时,就曾采用MCM封装技术,用以提升处理器执行效能。2005年,发布新款Pentium D和Xeon 5000系列CPU时,也都采用了MCM封装技术,当时是业界首款双核CPU。
不过,过去十几年,主流多核CPU更多采用原生多核设计,直到近几年,原生多核设计CPU的核心数量很难有更高增长,使得MCM封装技术重新崭露头角。
目前来看,越来越多新一代多核CPU开始采用MCM封装。2018年前后,AMD在设计64核服务器CPU时,就采用了该技术。AMD的这一设计是领先英特尔的,价格只是竞争对手Xeon处理器的一半,而且还更省电。做到这一点,是因为AMD采取了“老设计,新制程”策略,“老设计”就是已经很成熟的MCM封装技术,“新制程”则是采用当时最先进的7nm制程,以提高核心密度。近两年,AMD将该思路进一步拓展,也就是当下最为火爆的Chiplet及其封装技术。
对于CPU,特别是服务器CPU厂商来说,多核产品已经是标配,因为它不仅功耗更低,良率也能提高不少。采用MCM封装设计,厂商在设计多核CPU时,不用非要将所有核都放入单一晶粒,而是可以设计成多晶粒架构,也就是将一个大核分拆成多个小核,封装在多个晶粒里,再整合成单一CPU。与原生多核设计相比,采用MCM封装设计的多核CPU,核数可以实现突破性增长,甚至翻倍,这也是近些年AMD服务器CPU市场规模快速增长的一个原因。
不止AMD,原本主张原生多核设计的英特尔,也不得不做出妥协,近些年在设计新款多核CPU时,重新采用MCM封装,以实现更多核心数量和更高效能。
2019年发布第十代HEDT高端桌面处理器之后,英特尔已有两年多没推出HEDT新品,最新消息显示,该公司可能在2022下半年推出Golden?Cove高性能核心HEDT产品,主要是Sapphire?Rapids-AP。
在最近泄露的Xeon CPU基准测试中,消息人士表示,英特尔正在酝酿Sapphire?Rapids-AP新阵容,其中“AP”曾被用于使用MCM封装的旗舰级Cascade?Lake-AP产品线。Sapphire?Rapids-SP系列已采用过4组MCM设计,每个芯片最多有15个核,Sapphire?Rapids-SP被视作“AP”的衍生版本。有消息称,HEDT产品线虽然针对台式机市场,但英特尔更倾向于将其投放到工作站市场。作为采用MCM封装的产品,Sapphire?Rapids系列包含许多款SKU,旗舰款的热设计功耗可轻松突破350W。
近几年,苹果正在争夺英特尔和AMD的CPU市场,特别是笔记本电脑,苹果在较短时间内取得了不错的业绩。该公司设计的CPU同样看中了MCM封装设计。2021年12月,有业内人士展示了M1 Max芯片底部的隐藏部分,如下图所示,所展示的就是MCM,苹果采用该封装设计的主要目的是将多个Die堆叠在一起,从而大大增加CPU和GPU内核数量。
GPU跟进
随着GPU在数据中心的应用越来越普及,原本用于CPU的MCM封装技术开始向GPU领域渗透,特别是高性能计算,在业界受到了越来越多的关注。
传统显卡是带有多个GPU的PCB板卡,需要连接两个独立显卡的Crossfire或SLI桥接器。传统的SLI 和 CrossFire需要 PCIe 总线来交换数据、纹理、同步等。由于GPU之间的渲染时间会产生同步问题,因此在许多情况下,传统的双GPU显卡,即单个PCB上的两个芯片由它互连,每个芯片都有自己的VRAM。SLI或CrossFire的能耗很大,冷却也是一个挑战,这些在很长一段时间内都困扰着工程师。MCM是一个单独封装,其板载桥接器取代了传统两个独立显卡之间的Crossfire或SLI桥接器。在高性能计算应用领域,这种采用MCM封装的GPU优势明显。
最早将MCM封装技术引入GPU的是AMD。2020年,该公司把游戏卡与专业卡的GPU架构分家了,游戏卡的架构是RDNA,而专业卡的架构是CDNA,首款产品是Instinct MI100系列。2021年,AMD的Q2财报确认CDNA 2 GPU已经向客户发货了,其GPU核心代号是Aldebaran,它成为该公司首款采用MCM封装的产品。在PC方面,2022年引入下一代RDNA 3架构后,基于MCM的消费级Radeon GPU也会出现。
制造多芯片计算 GPU 类似于制造多核 MCM CPU,例如Ryzen 5000或Threadripper处理器。首先,将芯片靠得更近可以提高计算效率。AMD 的 Infinity 架构确保了高性能互连,有望使两个芯片的效率接近一个的。其次,使用先进的工艺技术批量生产多个小芯片比大芯片更容易,因为小芯片通常缺陷较少,因此比大芯片的产量更好。
不久前,AMD发布了基于RDNA 3架构的GPU,也就是Radeon RX 7000,该系列最新显卡有三款GPU,分别是Navi 31、Navi 32和Navi 33,其中,Navi 31和Navi 32将采用MCM封装。
GPU大厂英伟达也在跟进MCM封装。
目前,英伟达在MCM封装GPU上的方案称为“Composable On Package GPU”(COPA)。COPA GPU架构具有混合/匹配多个硬件块能力,它能更好地适应当今高性能计算的动态工作负载和深度学习环境。这种整合更适应多种类型工作负载,可带来更高水平的GPU复用。
面向数据中心和消费市场,英伟达分别推出了基于Hopper架构和Ada Lovelace架构的GPU。据悉,该公司只会在Hopper架构GPU上采用MCM技术,Ada Lovelace架构GPU仍会保留传统的封装设计。
作为英伟达第一款基于MCM技术的GPU,Hopper架构产品将采用台积电5nm制程工艺,支持HBM2e和其它连接特性,竞争对手是AMD的CDNA 2架构产品,以及英特尔的Xe-HP架构GPU。
在独立显卡GPU的研发方面,英特尔落后了不少,看到英伟达在GPU市场呼风唤雨,英特尔坐不住了,近些年在这方面大力投入,以期赶上产业步伐。而在MCM封装GPU方面,该公司也有了新动作。
不久前,英特尔公布新专利,描述了多个计算模组如何协同工作执行图像渲染,表示该公司GPU将采用MCM封装设计。在新专利中,英特尔提出GPU图像渲染解决方案,将多芯片整合至同一单元,解决制造和功耗等问题,同时优化可扩展性和互联性。
据悉,英特尔整合了运算模组的棋盘格式渲染,还有分布式运算,使多芯片设计GPU有更高的运算效率。虽然该公司没有对架构细节做深入描述,但估计搭载MCM封装GPU的Intel Arc显卡离我们不远了。
综上,无论是CPU,还是GPU,各大厂商都越来越多地采用了MCM封装技术,掀起了一波“复古”热潮。
原文标题 : 老瓶装新酒,CPU和GPU巨头的不谋而合