小米成立十周年,技术研发已成外界评判这家明星公司未来发展的重要指标。
去年,小米成立技术委员会,这被视作其全力攻坚核心技术研发及前沿科创领域的一大标志性举动。
而作为小米技术委员会首任主席,崔宝秋开始为更多人所熟知。
崔宝秋,本科毕业于武汉大学计算机系,拥有纽约州立大学石溪分校计算机博士学位。2012年6月,崔宝秋回国加入小米,组建人工智能与云平台团队,其后主导“云计算-大数据-人工智能”技术发展路线。2019年2月,崔宝秋担任小米集团副总裁、小米技术委员会主席。2019年4月,小米技术委员会全阵容班底正式亮相。
在崔宝秋的带领下,成立一年半的小米技术委员会又交出了一份怎样的答卷?
近期,雷科技等平台对崔宝秋进行了专访。站在小米成立十周年的历史节点,崔宝秋分享了自己对小米技术研发、用户隐私安全及小米未来发展的思考和感悟。
小米的技术研发路线图
近年来,小米持续加码研发投入。雷军在小米十周年公开演讲中透露,2020年小米研发预算达到100亿元。如何用好小米愈加大额的研发预算,雷军要认真考虑,崔宝秋更要时刻思索。
而从最近一年半的各项动作来看,小米面向未来的技术研发路线图已然浮出水面。
一、在设备端,小米形成了“手机+AIoT”两大核心引擎的技术研发体系。
从拍照到快充,从“灵弦算法”到AI相机,小米手机这两年拿出了不少自研新技术。例如最新发布的小米10至尊纪念版,小米自研的虚化算法在DxOMark中取得了单项特性75分的好成绩,并助力其相机DxOMark总分达到130,排名世界第一。这是小米手机虚化特性的历史最高分,也是当前的业内并列最高分。
而在AIoT设备领域,不管是生态链的扫地机器人产品,还是最新推出的小米透明电视,无不展现出小米对引领更多设备领域技术发展的强烈渴望。
二、在技术平台搭建上,小米形成了以“小爱同学”为中心的AI技术平台体系。
按照崔宝秋的话讲,小爱同学是小米“手机+AIoT”双引擎的控制中心。
我一直强调小爱同学不仅仅是一个语音助理,更是小米的AI,“小爱”中的这个“爱”就是AI,未来小爱同学就是小米的AI系统能力。
而如何通过小米在AI、IoT、大数据以及生态链所有端上的这些优势,打造一个无处不在、无所不能的小米AI能力系统,正是崔宝秋在关注和思索的课题。
当然,小爱同学目前在技术上的主攻点依然是智能语音。崔宝秋认为,语音交互是未来多模态交互中最重要的一种交互方式,小爱同学设备需要更加敏锐、正确地感知用户的需求,在这背后则需要小米自然语言处理技术能够更好认知用户需求,包括更加智能地预测用户需求。故而围绕语音技术研发这条线,崔宝秋表示小米的布局会非常深。
前沿技术研发的快速推进,往往离不开技术大牛的带动作用。在小米技术委员会成立后八个月,崔宝秋就请来了国际语音识别和AI领域知名教授Daniel Povey。
Daniel Povey,为大众更熟知的身份是语音识别开源工具Kaldi之父。Kaldi集成了多种语音识别模型,被认为是业界语音识别框架的基石,不仅受到人工智能学习和应用者的强度关注,而且极大推进了全球语音识别领域的发展。
崔宝秋表示,Daniel Povey加入小米后正在助其语音技术进一步做大、做强和做深。
我们想围绕语音从唤醒、识别到理解,再到未来更智能的多轮对话,带来更有人情味的,甚至有智商,让人感受有情商的小爱同学,这是我们要做的。
而就目前发展情况而言,小爱同学拥有如下核心技能:
语音技术:高灵敏度的语音唤醒、多场景高精度的语音识别、针对不同使用人群的声纹识别、语音合成等;
自然语言处理技术:语言处理基础技术、文本审核、情感分析、机器翻译、智能聊天等;
声学技术:波束形成、声源定位、去混响、降噪、回声消除、分布式拾音等;
智能问答技术:智能场景、个性化回复、多轮交互、情绪识别等。
需要指出的是,小爱同学并不是小米AI技术平台体系的全部。小爱同学之外,小米AI技术平台体系还涉及深度学习、计算机视觉及知识图谱等领域。
在计算机视觉领域,小米已经把人脸算法、人体算法、图像识别、图像增强、OCR等技术应用在设备端。
在深度学习领域,小米已经推出了端云协同的组合开发工具:移动端深度学习框架MACE和深度学习云服务平台Cloud-ML。
AI发展愈加强调在设备端上的能力技术,而小米早在2017年底就在内部推出了自研的移动端深度学习框架MACE,同时支持CPU、GPU和不同底层芯片。而在最新的MIUI 12中,小米手机用户亦可体验到MACE带来的诸如健康领域的“灵弦算法”以及拍摄领域的“魔法换天”、AI相机等功能。
MACE同样可以帮助小爱同学提升技能。崔宝秋介绍,小爱音箱的一些智能能力,未来是可以在设备端实现的,不一定非要来到云平台处理。比如,你带音箱出去玩,在非联网环境下,你提出一些问题,小爱依然可以理解你的意思,并向你提供对应的服务。
三、在开源社区和开放生态建设上,小米正在扮演愈加重要的角色。
2018年6月,借着“开源中国开源世界高峰论坛”的舞台,小米深度学习框架MACE首度登台亮相,崔宝秋宣布将其开源。
崔宝秋表示,相较“不够开放”的苹果机器学习框架Core ML,MACE可以为小米和更多Android设备提供深度学习领域各种各样的技能优化和能力定制。
而在邀请Daniel Povey加入小米担任首席语音科学家前,崔宝秋亦对其讲到了“四赢”:
1.Daniel和Kaldi项目要赢;
2.Kaldi的全球社区要赢;
3.小米AIoT生态要赢;
4.基于Kaldi的初创公司要赢。
显然,这体现出了崔宝秋对小米开源社区和开放生态建设的基本看法:不仅要助力小米及其生态链发展,同时也要实现多方共赢的局面。
所以,即便Daniel Povey加入小米,Kaldi也变成了小米项目,但崔宝秋表示小米Kaldi依然是开源的,而且要继续成为开放、公平和公益的项目。
对于开源软件及其平台的安全性问题,崔宝秋认为开源软件会更加安全。
因为开源是有大家在看,你提交一个代码,无数人在看,帮你审查你的安全漏洞。所以整体来讲,比如说一个闭源的,一个开源的,我更担心闭源的安全性,而不是开源的安全性。
在开放生态搭建上,小米同样在狂奔。目前,小米开放平台已经涵盖应用分发、应用服务、流量服务以及小米IoT、小米AI这五大平台。
小米AI开放平台主要面向技术和应用开发者,而小米IoT开发者平台的使命在于将生态链企业及其产品服务的盘子做得更大。
目前,小米IoT平台连接的智能设备数已经超过2.52亿台,服务超过5500万个家庭。对应的,小米IoT平台已接入的产品超过2000款,且有数十个品类的产品销量处于行业领先地位。
除了手机、电视、笔记本、路由器、智能音箱这五大自研品类,小米欢迎更多硬件制造企业、酒店/地产企业和智能硬件服务商加入小米IoT开发者平台,而其也将全面开放Wi-Fi、BLE、BLE Mesh、Zigbee、云云对接等IoT技术能力,并为这些企业及其产品服务提供更多的渠道销售资源。