视频流时代,相信快手这款APP是很多人每天必打开的软件,但很多人可能不知道,快手不仅仅是做短视频平台的,也在积极自研SoC。这也意味着,快手不仅仅有“老铁”,还有自研芯片了。
进军云端智能视频处理SoC芯片
近些年来,业内重点关注如何构建视频、直播的全链路方式,提升业务体验,其中主要存在四方面挑战,包括:1、如何快速上线?2、如何提高品质?3、如何扛规模?4、如何控成本?快手也以此为重点,每年研发投入超100亿元。
如今快手正式推出新品牌 “StreamLake”,定位于视频化升级的助推器,为客户提供视频化转型和升级的一站式解决方案,用音视频及AI能力赋能伙伴。
快手高级副总裁、StreamLake负责人于冰认为,随着5G广泛部署,未来视频将无处不在,但视频化升级面临体验痛点多,带宽成本高,创新和规模化效率低等难题。StreamLake把快手服务大规模用户所积累的基础设施、AI、音视频、算法等核心能力,通过模块化、标准化方式开放给其他企业,形成全链路服务。
其同时透露,快手以AI和音视频业务为重点,研制出面向视频直播点播应用的云端智能视频处理SoC芯片SL200和解决方案,目前已流片成功并正在进行线上内测。于冰指出,该芯片推出将提升行业技术实力,帮助客户和企业用更低的计算成本带来更高收益。
于冰表示,云端智能视频处理SoC SL200已经流片成功,目前正在进行内测,距离量产还有一段时间。据了解,该SoC主要用于视频压缩,毕竟快手的用户基数相当大,每天有大量的视频需要压缩处理,自研SoC在一定程度上可以降低运营成本,并且自身的技术实力也能够得到提升。
VPU大放异彩,众多大厂抢占赛道
过去几年,市场需求不断推动着国内造芯运动的热炒,尤其是芯片算力的提升,让云计算、人工智能、数据中心等领域愈发火热。巧合的是,快手此次进军的视频处理SoC,也成为了近期众多互联网大厂争相追捧的火热赛道。
VPU(英文名Video Processing Unit,视频处理单元)是一种全新的视频处理平台核心引擎,具有硬解码功能以及减少CPU负荷的能力。另外,VPU可以减少服务器负载和网络带宽的消耗。VPU由ATI提出,用于区别于传统GPU(英文名Graph Process Unit,图形处理单元)
在过去,视觉处理有多种技术可以使用,比如可编程逻辑阵列(FPGA)基于硬件可编程方式进行处理;嵌入式应用处理器(AP)可集成多种专用协处理器辅助处理;具有专用IP的单片系统(SoC)则可以直接将硬件处理单元植入系统平台。
在视觉处理市场需求激增情况下,人们对视频处理芯片的性能、功耗、价格和尺寸也有了更高更严格的要求,因此视频处理平台VPU成为一种全新的核心引擎。由于VPU中集成了多种专门进行视觉处理的硬件结构,因此在处理上可以有很大的超越,其综合性能可大幅度提升到每瓦性能超过600G FLOPS(浮点运算单位),是其它处理器的二至三倍,而价格仅为几分之一。
相关从业人士告诉笔者,虽然说VPU是针对视觉处理应用而设计,但其本质上也是一个SoC,内部集成有多个主控RISC的CPU、许多硬件加速器单元和矢量处理器阵列,专门为视觉海量像素设计的高性能影像信号处理器(ISP),以及丰富的高速外围接口。在保证强大性能和功能的前提下,VPU采用更先进的集成电路工艺,大大缩小了芯片的尺寸,并结合有效的技术手段,降低各个运算单元的功耗。
字节跳动
提起互联网巨头造芯,就不得不提到字节跳动。众所周知,快手、抖音是目前最为火热的两大短视频平台,二者不仅主打业务相似,在芯片研发上也选择了同样的方向。
在近期举办的“2022 火山引擎原动力大会” 上,字节跳动主管火山引擎、数据中台的副总裁杨震原披露了字节造芯最新进展,称自研芯片涉及视频编解码、云端推理加速等场景,并称字节也在和芯片供应商探索RISC架构芯片在云端的使用,已启动的各芯片自研自用,不会对外销售。他还强调,目前字节并没有开发CPU、GPU等通用芯片。
有媒体报道了字节造芯更加详细的情况。据悉,字节至少已启动了四个芯片项目,包括AI芯片、服务器芯片、FPGA NIC(FPGA形态的智能网卡,FPGA为可编程逻辑门阵列)项目和RISC-V项目。其中AI芯片已流片,服务器芯片的主要方向是视频编解码芯片。
字节确定造芯已近2年,最早起步于2020下半年,当时字节在内部已组建一个人数精简的团队。直到去年春天,字节芯片团队开始加速扩充,目前规模超过200人。具体来看,字节芯片团队负责人为 “Data-系统” 部技术总监王剑,他向杨震原汇报,王剑同时是字节今年成立的开源委员会的主要负责人之一,他于2016 年加入字节跳动,主要工作经验在于网络和数据系统架构,非芯片行业出身。
在王剑之下,字节芯片团队有数位技术负责人。包括AI芯片部门主要负责人施云峰和李继峰;RISC-V项目和服务器芯片项目由卢山负责;FPGA NIC项目由罗腊咏负责。目前,字节已启动的主要芯片项目与其主要业务联系紧密:视频编解码芯片对应抖音、TikTok等字节短视频应用的海量视频处理需求;AI芯片用以处理大量推荐算法;FPGA 智能网卡对应提升数据中心整体效率的需求等等。
在用量足够大的情况下,自研芯片可减少成本,更好控制供应,同时可实现更好的软硬协同,提升整体效果。
腾讯
在去年11月3日举办的腾讯数字生态大会上,腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏介绍,三款自研芯片已经取得进展,分别为针对AI计算的紫霄,用于视频处理的沧海以及面向高性能网络的玄灵。
据悉,沧海视频转码芯片支持硬件编码器,该芯片已流片并点亮,沧海芯片采用12nm工艺,实现了以更小的数据量、更小的带宽提供相同质量的视频,压缩率相比行业最佳表现提高了30%以上。此外,腾讯AI推理芯片紫霄,性能相比业界提升100%,目前已经流片成功并顺利点亮;同时,腾讯研发的智能网卡芯片玄灵相比起业界产品性能提升了4倍。
除了互联网巨头以外,国内还不乏北京君正、好利科技等传统新品企业。北京君正方面,拥有完全自主设计的VPU技术,公司在过去四年来一直加强视频编码技术的研发,目前的264和265/HEVC编码器在性能、功耗等指标上都达到了业界先进水平;好利科技旗下曲速科技的第一颗VPU芯片得到了业内资深行家的认可,VPU目前出货量较为顺畅,公司整个团队在大芯片方面有较为资深的实力,将有助于推动目标公司相关芯片产品的研发进度。
不管是对于快手还是字节,自研芯片最大的优势在于能够实现定制化,能为公司产品带来差异化特点。尤其是当前视频流信息大行其道,谁能带来更高画质、更多特效的视频流内容,势必离不开视频处理芯片的性能和相应的算法配套;其次,自研芯片也能为企业大幅降低成本;最重要的是,视频流内容所包含的信息较为私密,不管是用做素材还是公开发布,企业自研芯片,也有利于为用户更好的保护数据安全。