在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros,该技术能将语音生成算法的计算效率提高百倍以上。
阿里达摩院介绍,在使用AI语音合成算法WaveNet生成1秒语音的情况下,如果底层硬件采用的是CPU和GPU,生成语音需要花费50秒,但如果采用Ouroboros,在FPGA环境下完成生成只要 0.3秒。
据悉,Ouroboros的一大突破是用端上定制硬件加速技术替代云端服务器,避免了对网络连接和云端服务的强依赖性。此外,Ouroboros 芯片技术除了语音合成之外,还将支持AI语音识别。
阿里达摩院透露,基于Ouroboros研发完整的语音AI芯片有望率先在天猫精灵上落地,此外它还有可能应用在汽车(比如上汽荣威)和手机上,以支持高德地图的语音交互。