老瓶装新酒，CPU和GPU巨头的不谋而合

近些年，以CPU和GPU为代表的处理器在应用需求的推动下，相关的设计、制造和封装等技术都在发展变化当中。封装方面，虽然当下的3D技术很热，但对于绝大多数处理器来说，2D和2．5D封装技术仍是主流，而传统的MCM（Multi－Chip－Module，多芯片模块）焕发了第二春，各大CPU和GPU厂商都在大规模部署采用这种封装技术的产品。

MCM是一种由两个及以上Die，或者芯片尺寸封装（CSP）的IC组装在一个基板上的模块，形成一个电子系统或子系统，基板可以是PCB、陶瓷或硅片。整个MCM可以封装在基板上，也可以封装在封装体内。MCM可以是便于安装在电路板上的标准化封装，也可以是一个具备电子功能的模块，它们都可直接安装到电子系统中（PC、仪器、机械设备等）。

MCM可分为以下三种基本类型：

MCM－L：是采用片状多层基板的MCM，MCM－L是高密度封装的PCB技术，适用于采用键合和FC工艺的MCM。MCM－L不适用于有长期可靠性要求和使用环境温差大的场合。

MCM－C：是采用多层陶瓷基板的MCM，适于模拟电路、数字电路、混合电路、微波器件等多种应用。

MCM－D：是采用薄膜技术的MCM，MCM－D的基板由多层介质、金属层和基材组成。介质层要求薄，金属互连要细小，同时具备适当的互连阻抗。

MCM封装的优点可以概括为以下三点：1、可大幅提高电路连线密度，提升封装效率；2、可完成“轻、薄、短、小”的封装设计；3、可提升封装的可靠性。

近些年，SiP封装技术深入产业人心，那么，MCM与它相比如何呢？实际上，芯片封装技术的发展是不断进步和创新的过程，是对原有技术的整理、迭代、创新和再发展，MCM和SiP也是如此。MCM是在各种高密度多层基板上封装，主体是Die，制成部件的电路一般较为复杂，因此，MCM是一种高级混合集成技术。SIP的市场规模和增长空间比MCM大，SIP是MCM进一步发展的产物，是芯片和元器件在不同工作频段的高密度组装和互连。MCM主要通过将各种Die堆叠连接，元器件较少，通常以数字芯片、存储器为主，而SIP可封装不同制程工艺、不同功能的芯片，芯片之间可进行信号的存取和交换，从而实现一个系统目标产品的全部互连、功能和性能。

可见，相对而言，SiP比MCM先进，但这并不影响后者被越来越多的CPU和GPU厂商采用。因此，成熟的技术并不一定不如先进技术，这与近些年成熟制程节点技术火爆，产能供不应求的局面有异曲同工之妙。

MCM CPU大行其道

对于CPU而言，MCM并不是新技术，早在1995年，英特尔推出Pentium Pro时，就曾采用MCM封装技术，用以提升处理器执行效能。2005年，发布新款Pentium D和Xeon 5000系列CPU时，也都采用了MCM封装技术，当时是业界首款双核CPU。

不过，过去十几年，主流多核CPU更多采用原生多核设计，直到近几年，原生多核设计CPU的核心数量很难有更高增长，使得MCM封装技术重新崭露头角。

目前来看，越来越多新一代多核CPU开始采用MCM封装。2018年前后，AMD在设计64核服务器CPU时，就采用了该技术。AMD的这一设计是领先英特尔的，价格只是竞争对手Xeon处理器的一半，而且还更省电。做到这一点，是因为AMD采取了“老设计，新制程”策略，“老设计”就是已经很成熟的MCM封装技术，“新制程”则是采用当时最先进的7nm制程，以提高核心密度。近两年，AMD将该思路进一步拓展，也就是当下最为火爆的Chiplet及其封装技术。

对于CPU，特别是服务器CPU厂商来说，多核产品已经是标配，因为它不仅功耗更低，良率也能提高不少。采用MCM封装设计，厂商在设计多核CPU时，不用非要将所有核都放入单一晶粒，而是可以设计成多晶粒架构，也就是将一个大核分拆成多个小核，封装在多个晶粒里，再整合成单一CPU。与原生多核设计相比，采用MCM封装设计的多核CPU，核数可以实现突破性增长，甚至翻倍，这也是近些年AMD服务器CPU市场规模快速增长的一个原因。

不止AMD，原本主张原生多核设计的英特尔，也不得不做出妥协，近些年在设计新款多核CPU时，重新采用MCM封装，以实现更多核心数量和更高效能。

2019年发布第十代HEDT高端桌面处理器之后，英特尔已有两年多没推出HEDT新品，最新消息显示，该公司可能在2022下半年推出Golden?Cove高性能核心HEDT产品，主要是Sapphire?Rapids－AP。

在最近泄露的Xeon CPU基准测试中，消息人士表示，英特尔正在酝酿Sapphire?Rapids－AP新阵容，其中“AP”曾被用于使用MCM封装的旗舰级Cascade?Lake－AP产品线。Sapphire?Rapids－SP系列已采用过4组MCM设计，每个芯片最多有15个核，Sapphire?Rapids－SP被视作“AP”的衍生版本。有消息称，HEDT产品线虽然针对台式机市场，但英特尔更倾向于将其投放到工作站市场。作为采用MCM封装的产品，Sapphire?Rapids系列包含许多款SKU，旗舰款的热设计功耗可轻松突破350W。

近几年，苹果正在争夺英特尔和AMD的CPU市场，特别是笔记本电脑，苹果在较短时间内取得了不错的业绩。该公司设计的CPU同样看中了MCM封装设计。2021年12月，有业内人士展示了M1 Max芯片底部的隐藏部分，如下图所示，所展示的就是MCM，苹果采用该封装设计的主要目的是将多个Die堆叠在一起，从而大大增加CPU和GPU内核数量。

GPU跟进

随着GPU在数据中心的应用越来越普及，原本用于CPU的MCM封装技术开始向GPU领域渗透，特别是高性能计算，在业界受到了越来越多的关注。

传统显卡是带有多个GPU的PCB板卡，需要连接两个独立显卡的Crossfire或SLI桥接器。传统的SLI 和 CrossFire需要 PCIe 总线来交换数据、纹理、同步等。由于GPU之间的渲染时间会产生同步问题，因此在许多情况下，传统的双GPU显卡，即单个PCB上的两个芯片由它互连，每个芯片都有自己的VRAM。SLI或CrossFire的能耗很大，冷却也是一个挑战，这些在很长一段时间内都困扰着工程师。MCM是一个单独封装，其板载桥接器取代了传统两个独立显卡之间的Crossfire或SLI桥接器。在高性能计算应用领域，这种采用MCM封装的GPU优势明显。

最早将MCM封装技术引入GPU的是AMD。2020年，该公司把游戏卡与专业卡的GPU架构分家了，游戏卡的架构是RDNA，而专业卡的架构是CDNA，首款产品是Instinct MI100系列。2021年，AMD的Q2财报确认CDNA 2 GPU已经向客户发货了，其GPU核心代号是Aldebaran，它成为该公司首款采用MCM封装的产品。在PC方面，2022年引入下一代RDNA 3架构后，基于MCM的消费级Radeon GPU也会出现。

制造多芯片计算 GPU 类似于制造多核 MCM CPU，例如Ryzen 5000或Threadripper处理器。首先，将芯片靠得更近可以提高计算效率。AMD 的 Infinity 架构确保了高性能互连，有望使两个芯片的效率接近一个的。其次，使用先进的工艺技术批量生产多个小芯片比大芯片更容易，因为小芯片通常缺陷较少，因此比大芯片的产量更好。

不久前，AMD发布了基于RDNA 3架构的GPU，也就是Radeon RX 7000，该系列最新显卡有三款GPU，分别是Navi 31、Navi 32和Navi 33，其中，Navi 31和Navi 32将采用MCM封装。

GPU大厂英伟达也在跟进MCM封装。

目前，英伟达在MCM封装GPU上的方案称为“Composable On Package GPU”（COPA）。COPA GPU架构具有混合／匹配多个硬件块能力，它能更好地适应当今高性能计算的动态工作负载和深度学习环境。这种整合更适应多种类型工作负载，可带来更高水平的GPU复用。

面向数据中心和消费市场，英伟达分别推出了基于Hopper架构和Ada Lovelace架构的GPU。据悉，该公司只会在Hopper架构GPU上采用MCM技术，Ada Lovelace架构GPU仍会保留传统的封装设计。

作为英伟达第一款基于MCM技术的GPU，Hopper架构产品将采用台积电5nm制程工艺，支持HBM2e和其它连接特性，竞争对手是AMD的CDNA 2架构产品，以及英特尔的Xe－HP架构GPU。

在独立显卡GPU的研发方面，英特尔落后了不少，看到英伟达在GPU市场呼风唤雨，英特尔坐不住了，近些年在这方面大力投入，以期赶上产业步伐。而在MCM封装GPU方面，该公司也有了新动作。

不久前，英特尔公布新专利，描述了多个计算模组如何协同工作执行图像渲染，表示该公司GPU将采用MCM封装设计。在新专利中，英特尔提出GPU图像渲染解决方案，将多芯片整合至同一单元，解决制造和功耗等问题，同时优化可扩展性和互联性。

据悉，英特尔整合了运算模组的棋盘格式渲染，还有分布式运算，使多芯片设计GPU有更高的运算效率。虽然该公司没有对架构细节做深入描述，但估计搭载MCM封装GPU的Intel Arc显卡离我们不远了。

综上，无论是CPU，还是GPU，各大厂商都越来越多地采用了MCM封装技术，掀起了一波“复古”热潮。

原文标题 : 老瓶装新酒，CPU和GPU巨头的不谋而合

老瓶装新酒，CPU和GPU巨头的不谋而合

相关推荐