2022年1月7日,微软正式宣布,在基于微软智能云Azure的深度神经网络TTS(Text-to-Speech)支持下,中国领先的智能电动汽车公司小鹏汽车已经顺利完成其车规级语音助手的升级,进一步提升智能汽车语音助手的技术水准。
目前,购买小鹏汽车P7车型的中国用户,可以通过OTA(Over-The-Air)升级这款可媲美人声的全新智能语音助手“小P”,小鹏汽车也计划通过OTA将这一技术升级引入其他几款车型当中。
得益于过去几年微软在语音、自然语言和机器翻译领域的研究成果,语音助手技术在流畅度、质量、保真度和自然度上都得到了极大提升。
在经过与微软Azure人工智能技术和其他产品的整合之后,这些技术创新成功助力了像小鹏汽车这样的企业,为其消费者带来更为丰富和更具吸引力的用户体验。
在为期数月的合作中,微软与小鹏汽车携手攻克了语音合成技术应用面临的三个技术挑战:
首先,为了解决汽车场景下的网络抖动问题,高质量保障语音功能的持续运行,小鹏汽车搭建了多级缓存架构,可以提前预置和缓存高质量语音文件,最大程度上降低了该功能对网络的依赖;
其次,为了在不占用过多资源的前提下,依然能提供媲美人类的真实声音体验,小鹏汽车借助了微软智能云Azure的缓存和压缩功能,可以将语音文件压缩到24KHz的采样率和16位的量化水平,大大减少了数据网络和整车算力的资源压力;
最后,双方还在减少合成语音歧义和多音字优化准确性方面做出了诸多改进。
在双方的努力下,全新的车载语音合成功能在语音保真度、功能性和场景优化上都达到了新的水平,小鹏汽车能够在更多的使用场景中部署语音助手,让其成为直观驾驶体验中不可或缺的一部分。
小鹏汽车AI产品高级专家郝超表示:“从确定合作意向到产品上线,我们与微软耗时数月,携手完成了一次对汽车语音交互技术的前沿探索,将车载语音的自然语音水平提升到了一个全新的水准。随着对城市出行的理解愈发深入,和更多使用场景的发掘,这些技术成果将获得更为广泛的应用,实现高水平的人机共驾体验。”
微软汽车、出行和运输行业总经理Sanjay Ravi表示:“随着研究和技术的进步,Azure认知服务(如视觉和语音)将在定义独特的车载体验方面发挥关键作用。智能语音正在成为主要的车载交互工具,而微软预置的深度神经语音和个性化深度神经语音定制服务,将助力汽车制造商强化自身品牌,打造更接近自然人声的、差异化且真实的用户体验。”
除了小鹏汽车外,微软还与多家汽车制造商及合作伙伴在智能汽车领域展开深入合作,专注于助推汽车行业的智能应用提升。
不同厂商的智能需求不同,从人机交互到驾驶信息分析、判断、决断等角度出发,不同品牌、车辆需要载入不同需求的智能应用。
微软基于强大的语音语义及数据架构的底层平台,通过强大的技术能力和底层平台赋能众多智能汽车厂商,开发形态多样的信息数据的中控显示语音系统、配合多维的硬件结构,让用户体验更智能的驾驶座舱交互感受。