语义识别的历史
使机器识别语言是人类早已有之的科技幻想,并且早有实践足迹。早在1920年,美国一家公司所出品的名为“Radio Rex”玩具狗便可以“听从”主人的话而执行走或者停的任务。
不过在这之后相当长的时间里。这项科技的进展仅限于如何更多、更精确地识别各种口音,进而执行诸如文字显示等十分简单的任务。
1952年,贝尔实验室的Davis等人成功研究出了世界上第一个能识别10个英文数字发音的实验系统。大规模的语音识别研究是在进入了上个世纪70年代以后,在孤立词和小词汇量句子的识别方面取得了实质性的进展。
进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。此时语音识别的研究思路也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型 (HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路,亦即开始了跨学科的人工智能研究道路。
进入90年代以后,语音识别的研究并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展,诸如听写机等基于语音的信息输入设备此时大量出现。
由仅限于定义为输入法功能的语音识别,向包含后台数据分析的语义识别转型的关键推动力量,是美国的DARPA(Defense Advanced Research Projects Agency)计划。
显然,语义识别技术蕴含着着人机互动的远大前景,也因此拥有各方足够高的评价和期许。但它几十年来却缺乏足够的表现。而正是苹果公司往日给社会带来巨大变革的一系列消费级产品,使得当语义识别技术和苹果公司联系到一块的时候,人们不得不重新给予其重大期盼。
实际上,苹果公司对类似工作的开展也不可谓不早。早在1987年,苹果就展开了类似的研究工作。如果你曾经读过李开复的自传《世界因你不同》,就可能会对在《今日美国》节目中,苹果出品的实验性语音识别设备Casper“调戏”女主持的情节记忆犹新。
Siri是从斯坦福大学的SRI国际人工智能中心(International Artificial Intelligence Center)剥离的一个项目,该研究中心隶属于DARPA 的CALO子项目。实际上,Siri的联合创始人兼工程副总裁Adam Cheyer正是CALO项目的首席架构师,而CTO Tom Gruber也是出身斯坦福大学的人工智能、语义网专家。同样孵化于斯坦福SRI的还有知名的语音识别开发公司Nuance。
2010年初,苹果收购Siri,收购价据称是2亿美元。
Siri的无限可能
当苹果刚刚收购Siri之时,人们评价它只是一个更好的语音识别工具。然而,事实并非如此。