智能语音作为入口已渗透到了很多领域,从智能音箱到智能台灯,从智能家电到汽车的智能中控、后视镜,以及工业或陪伴式机器人,智能语音可在消费、汽车、教育、工业等各个领域开花结果。
所谓的智能语音就是给语音加了“大脑”,让其理解用户通过语音表达出来的意图和需求,并且可以把对应的内容返回给用户。
“现阶段,智能语音的落地主要受消费电子市场激烈的竞争格局所驱动,各厂商都期望赋予产品新卖点与新亮点。语音在消费市场尤为火热,除了苹果、谷歌、亚马逊等行业巨头纷纷入场之外,还存在众多跟风者。而其它领域,如汽车电子、工业医疗等,由于行业门槛或需求不集中等原因,虽被看好但仍需一定时间才能被市场接受。” 意法半导体模拟、微电机产品部市场经理倪明如是说。
意法半导体模拟、微电机产品部市场经理倪明
市面上有很多智能语音方案,背后的关键技术是硬件、算法以及云服务。
倪明介绍道:“意法半导体在硬件上有自己的特色,能够提供市场上应用很普遍的STM32系列MCU作为主控,再加上2颗或4颗硅麦克风组成麦克风阵列;在声学算法方面,意法半导体可提供Beam Forming (语音指向)、Sound Localization (声源定位)、Echo Cancelation (回声消除) 这些声学前端算法,后端的声学算法如本地、云端的语音识别,将由第三方合作伙伴 (如Sensory、科大讯飞等) 来提供。”
对于近场语音识别,比如智能穿戴、陪伴式机器人,上述意法半导体方案即可满足需求;对于远场的语音识别,比如智能音箱,意法半导体将负责语音前端处理,AP或DSP的第三方算法将负责后端处理,因此需要与高通等后端AP厂商配合实现。
倪明表示:各厂商的智能语音方案都独具特色,现有的语音方案在功能上基本满足了市场的需求,但可扩展性及性能仍有改进空间。比如使用者会经常遇到听不到、听不清的情况,语音产品易被干扰且存在功耗大等问题。解决这些问题需要系统各方面的共同改进。意法半导体本着开放的态度与行业各方合作共赢。
倪明指出理想的应用或产品应该是“按需分配”:即根据用户或市场的需求,系统可以做出适当的取舍与调整。与此同时,倪明介绍了意法半导体在理想化产品道路上做出的努力:
作为系统基础的硬件,硅麦克风至关重要。意法半导体在提高其本体性能方面,将SNR提高到65~67dB、 AOP提高到135dBSPL,以及在麦克风ASIC电路中加入抗干扰的设计等;
在意法半导体Beamforming算法库中有4种针对不同应用场景的模式供选择,既有适用于智能穿戴等语音方向较确定的场景下强指向模式 (Strong) ,也有适用于语音方向范围较宽、环境噪声较大场景下的消噪模式 (Cardioid denoise) ;
在功耗方面,意法半导体新发布的MP23DB01HP数字硅麦克风可以支持低功耗模式,该模式下麦克风的功耗还不到正常模式的一半,极大地提高了系统的持续工作时间。例如手机穿戴产品中需要集成度更高、更加低功耗的方案,意法半导体正在与合作伙伴研发将麦克风与DSP合二为一的芯片“Smart MIC”,该芯片将大大节约PCB布板空间及系统功耗。