说完最大的GPU,我们看一下最大的FPGA。就在几天前,各大FPGA粉丝群里面有一个新闻刷屏了,那就是赛灵思推出了史上最大的FPGA芯片“Virtex UltraScale+ VU19P”。该芯片拥有多达350亿个晶体管,密度在同类产品中也是最大的,相比上代Virtex UltraScale VU440增大了1.6倍,而功耗降低了60%。从晶体管数量来看,超过了AMD 64核心的二代霄龙和英伟达GV100。
马克杯口大小的FPGA,汽车后备箱大小、重大300斤的GPU,还有就是一片晶圆一颗芯片的Cerebras WSE。到底是什么在驱动芯片越做越大?
寻觅通用人工智能的硬件最优解
不管是各界人士的评论里,还是产品的介绍里,最大芯片们都有一个共同的标签,那就是人工智能。
是的,人工智能出来了许多年,也火了许多年。但是,现在的人工智能让很多地方政府和投资机构觉得像“鸡肋”,实在是食之无味,弃之可惜。造成这一局面的一个很重要的原因在于,当算法在不断精进的过程中,芯片性能开始滞后,应对单一领域计算已经乏力,更不要说什么通用人工智能了。
当前的AI芯片的设计思想主要有三大类。分别是专用于机器学习的加速芯片;类脑仿生芯片;可高效计算各类人工智能算法的通用AI芯片。
GPU和FPGA性能的不断提升,以及TPU、NPU和ASIC的出现让机器学习方面应用有了快速发展,已经实现了部分落地场景。而在类脑芯片和通用AI芯片方面迟迟没有动静,因此,Cerebras WSE的出现确实让人们看到了曙光。
理想的AI芯片需要具备高度并行的处理能力,能够支持各种数据长度的按位、固定和浮点计算,芯片本身具有高端带、低延迟,在核心计算单元和内存之间有丰富的链接,在实现高性能运算的情况下兼备低功耗的特点。并且,这样的芯片还要低成本。
在Cerebras WSE出现之前,虽然英伟达推出了大型GPU这样的产品,但是大家对于实现通用AI更为认可的方式是可重构架构设计。通过这种架构设计的可重构芯片具备软件、硬件双编程的特性,硬件架构和功能随软件变化而实时动态变化,因而又被称为软件定义芯片。可重构芯片的基础思路是通过找到数据间的依赖关系,然后通过这种关系进行实践切割,然后对计算进行分配,最终实现资源的复用。
可重构芯片的基础架构
目前,可重构芯片应用到的技术主要有计算阵列重构、存储带宽重构和数据位宽重构。通过采用上述技术,软件定义的层面不仅仅局限于功能这一层面,算法的计算精度、性能和能效等都可以纳入软件定义的范畴。
在可重构芯片领域,目前主要玩家包括传统芯片公司英特尔和赛灵思,还有初创公司Cerebras、Wave computing、寒武纪、比特大陆等。
是的,你没有看错,Cerebras同样是可重构芯片的玩家之一。不过,Cerebras WSE的价值绝不仅仅是可重构,其在芯片设计和芯片制造方面都有里程碑的意义。
在芯片设计方面,Cerebras WSE绝对算是一次大胆且成功的尝试。单一芯片上做大规模的计算核心集成,节省了芯片之间传输的时间和功耗,这样的方式比传统在数据中心做训练明显更经济实惠,不仅大大提升了训练的效率,成本也有望降低。另外,其内部核心不做乘零运算,给予当前的AI芯片以提示,大大缩减了模型训练的时间,这对于当前的人工智能产业而言价值非凡。
在芯片制造方面,台积电在这颗史上最大芯片面世过程中同样居功至伟。台积电高级副总裁Brad Paulsen表示,台积电调整其设备以进行一次连续设计,而不是多个独立设计的网格,从而从300毫米的晶圆上,切割下来一个最大的正方形来做芯片。是的,有了台积电的鼎力支持才会有这颗史上最大芯片,同时也掀开了晶圆代工的新篇章。
Cerebras用最大芯片给通用AI芯片设计提供了一个全新的思路,当材料和设备的物理极限难以突破时,放大芯片的尺寸在大规模运算中不失为一种好方法。不过,就算有可重构的计算方法,Cerebras WSE也仅仅是作为多种算法的兼容,并不能让基于一种数据经过训练后得到的模型同时适应多种应用场景,这还需要算法上面做攻关。
当然,Cerebras WSE肯定不是完美的。首先第一个要解决的问题就是散热问题,不管是芯片做高,还是芯片做大,散热都是共同的难题;其次是生态问题,打破常规的芯片就需要打破常规的系统和机器;第三是算力分配问题,当年联发科“一核有难,多核围观”的窘境相信很多人都还记得,40万个内核如何协调工作是个大问题;最后是时序问题,如此巨大的芯片如何能够做到信号传输不延迟。
总结
诚然,我们对于Cerebras WSE的商用还有诸多疑问,它的散热、生态、时序等等。但是,我们不得不说,这颗芯片是超越摩尔定律路线上浓墨重彩的一笔,在AI大数据并行的应用场景中也独具优势。我们期待有一个通用的AI芯片有朝一日能够像CPU一样通用,搭载着更先进的算法跑在我们身边的智能设备中。
无论如何,Cerebras WSE都将成为世界芯片发展史上的一座里程碑。