本报记者曲忠芳李正豪北京报道
近日,微软(NASDAQ:MSFT)宣布完成对老牌智能语音厂商Nuance的收购,Nuance正式从纳斯达克证券交易所摘牌退市。在这笔价值197亿美元的收购案引发业界关注的同时,智能语音技术赛道的商业化之路也持续被考问着。
智能语音是人工智能(AI)领域技术最为成熟的分支,其研究始于上世纪50年代,直到90年代步入产业化道路,Nuance和国内的科大讯飞(002230.SZ)等均成立于这一时期,2010年前后行业步入变革式发展期,国内涌现出众多智能语音公司,如思必驰、云知声、出门问问、声智科技等。从落地应用来看,由2014年底亚马逊Echo开启的智能音箱大规模普及,打开了消费者对语音交互的认知,截至目前,AI语音已广泛应用在家居、金融、汽车、教育、办公、医疗健康、地产等社会经济生活的方方面面。
综合多家第三方研究机构的数据来看,智能音箱发展的这些年,无论是国内还是国际市场早已是一片“红海”,且从2020年起热度与关注度明显下降,AI语音厂商纷纷加快转型步伐,谋求商业模式的突破。《中国经营报》记者通过多方采访及梳理发现,究竟向上做芯片,还是向下做消费硬件;是向底层做系统,还是做与商业距离最近的AI方案,AI语音企业在向纵深处“掘金”过程路径开始分野。
转型探索的不同路径
前不久,思必驰旗下智能硬件品牌“思麦耳”推出了首款产品,即360°降噪会议麦克风音箱,具有智能降噪、免费音频实时转写等功能。
思必驰相关负责人向本报记者表示,这款产品替代的是传统的会议麦克风,即俗称的“八爪鱼”,并加上了语音实时转写文字的功能。思麦耳主要面向商业办公市场,此前公司已推出了针对车载领域的子品牌“车萝卜”,这些产品是toB(企业级市场)和toC(消费者市场)的延伸,作为公司战略的一部分。
该负责人进一步指出,消费电子产品都有生命周期,目前硬件本身并不赚钱,先把品牌和用户做起来,后续会继续上线一些增值服务,拓展营收模式。
公开数据显示,思必驰于2007年成立于英国剑桥,次年回国落户苏州,2014年剥离了教育业务,2016年升级“云+芯”战略,2018年成立了芯片公司深聪智能,打造“算法+芯片”一体化的整体解决方案。2021年4月完成股份制改造,目前已进入上市辅导期。
另一家同样向上游押宝AI芯片的云知声,曾于2020年11月提交IPO申请,拟在科创板上市,但仅隔3个月后云知声主动撤回了上市申请。根据公开资料及当时的招股书披露,云知声从2015年就开始搭建芯片团队,从2017年至2020年上半年,云知声分别投入553.03万元、1166.93万元、6071.15万元和1755.80万元,面向物联网领域的“雨燕”和面向小家电市场的“蜂鸟”系列芯片已量产和规模销售,“雪豹”车规级芯片尚在进行稳定性测试。
成立于2016年、以声学远场交互技术起家的声智科技相关人士告诉记者,AI语音的应用早就不只是单链路的技术,公司现在的核心特色是Azero人工智能框架,在前不久闭幕的2022年北京冬奥会上,声智科技承担了“冬奥核酸应检尽检决策系统”、冬奥核酸“声智门”(IDA数字哨点系统)、“冬奥赛事综合保障组指挥调度平台”、“冬奥大脑-冬奥人员信息分析系统”等4项数字基础设施,围绕核酸检测健康的安全、餐饮住宿全流程的安全这两项安全需求,服务保障所有的运动员和奥运会工作人员。
记者整理后发现,以AI算法起家的企业大多成立于2010年前后,在2015年前后转型,到现在转型的路径较为清晰,一是AI解决方案,二是AI硬件,包括消费电子产品、办公会议产品等,三是AI专用芯片,四是AI操作系统,当然这四种路径并不相互排斥。更值得注意的是,几乎每一个细分赛道上都竞争激烈,尤其以智能音箱为代表的消费电子领域,更是巨头林立,红利殆尽。
深度科技研究院院长张孝荣认为,智能音箱已经到达行业天花板,开始进入产业衰退期,由于产品体验不理想,用户流失率很高,市场关注度持续下降。互联网产业观察家张书乐持相同看法,他认为AI语音技术目前来说整体“智商”还满足不了消费者的高期望值,AI公司希望通过智能音箱和消费者交互来达成所谓深度学习和个性化服务的能力,目前也没实质性的突破。
破局之路仍在探索期
科大讯飞AI研究院副院长陈志刚指出,“目前很多AI企业都在转型,这是可以理解的,是一定程度上必然的趋势。”AI技术要落地一定会涉及平台,也就是说用什么样的载体、在什么操作系统上,有什么样的嵌入式硬件,AI的能力在各种条件下跑得起来,服务更多的场景,是非常系统化的事情。很多落地过程需要各个环节的密切配合,才可以将价值最大程度地挖掘出来。
AI语音公司的生存现状如何?因为2010年前后成立的这些AI公司大多还没有上市,营收结构及财务数据并未公布,这里只以老牌企业科大讯飞、提交过IPO申请的云知声作为简单参考。
云知声招股书显示,在2017年、2018年、2019年及2020年上半年,该公司实现营收分别为6114万元、1.97亿元、2.19亿元、8469万元;净亏损分别为1.74亿元、2.14亿元、2.92亿元和1.12亿元,三年半时间累计亏损额近8亿元。报告期内,云知声的毛利率水平在30%左右,2020年上半年为31.66%,相比于其他申请IPO的视觉类AI企业,这一数据偏低。
从营收结构来看,云知声主营业务包括三部分,各部分的占比呈现较大的变动:智能语音交互产品,即物联网语音交互产品、智能语音工具产品等,营收占比由2017年的97%降到2020年上半年的28%;智慧物联解决方案,主要面向酒店、社区、住宅、医院等特定场景,2020年上半年,智慧物联解决方案收入在总营收的占比超过67%;人工智能技术服务,在总营收中的占比近5%。
科大讯飞是国内最老牌的、以语音合成起家的AI企业,截至3月10日收盘,科大讯飞的总市值约1092亿元。根据财报披露,按产品划分,科大讯飞的营收贡献比前四位分别是教育产品和服务、开放平台、信息工程、运营商相关业务,其中教育产品和服务约占比三成。其他营收贡献还来自于智能硬件、智慧政法行业应用、汽车智能网联相关业务、移动互联网产品及服务、教学业务、医疗业务、智慧金融产品和解决方案等。2021年前三个季度,科大讯飞营收108.68亿元,净利润为7.68亿元,同比增幅分别为49%、24%。不过,因保持较高的政府补贴,科大讯飞的商业模式及盈利能力在一定程度上也受到疑问。
大体来看,AI语音企业的营收来源是以落地应用于各行业领域的AI解决方案为主,其次是消费电子产品。无论是做AI芯片还是AI操作系统,目前还处于研发投入的阶段。无论是哪一条转型道路,AI语音公司仍面临严峻的挑战。
对于当下的“造芯”热潮,CHIP全球测试中心中国实验室主任罗国昭就指出,语音识别技术并不是新鲜的AI技术,不考虑语义识别的话,实际上已非常成熟,甚至无需专用硬件。使用专用语音芯片的核心意义在于降低软件开发成本,特别是与操作系统适配的成本。因此语音识别芯片最核心的研发方向就是降低成本,包括芯片、代码,开发成本以及功耗、延迟成本。“做好难,做便宜其实更难。便宜的话,还需要有更广泛的设备及用户使用,这就考验开发厂商的销售以及产品外延能力。”罗国昭说。