图片来源:视觉中国
记者|崔鹏
虚拟数字人赛道正在成为各大互联网公司争相追赶的新风口。
7月19日,百度数字人与机器人业务负责人李士岩接受了界面新闻在内的多家媒体采访,详细介绍了百度智能云曦灵平台和数字直播人业务的最新进展。
该平台于2021年底在百度AI开发者大会上正式发布,集数字人生产、内容创作、业务配置服务为一体,主要为广电、互娱、金融、政务、运营商、零售等行业提供虚拟主持人、虚拟员工、虚拟偶像、品牌代言人的创建与运营服务。
据李士岩介绍,曦灵目前拥有四个比较成熟的子平台:数字人手语平台、数字明星运营平台、数字人直播平台以及与交互能力相关的对话配置平台。通过它们来支撑广电、互娱、MCN、艺人经纪公司和品牌商等解决方案,支持平台的商业化业务。
百度认为,数字人产业目前最大的痛点是链条非常长:除了做模型、做绑定、做动力学,还要软件公司帮忙做集成;如果需要语音则要找做语音的公司,需要视觉再找做视觉的AI公司,最后让工程师来做集成。
在李士岩看来,百度是国内唯一一家既有视觉能力,又有语音、语义相关包括计算机图灵学自动生成全链路AI能力平台型的公司,底层全栈AI能力是曦灵的优势;再往上是各个类型人像生产线,以及人设管理平台。人设生产出来之后,百度再通过交互服务或者生产内容的方式,满足客户的需求。
这里还牵扯到数字人的类型划分问题,百度将自己的数字人产品分为服务型跟演艺型两类。
“在我们来看,数字人的第一性原理就是两件事:第一是交互,第二是内容。”李士岩解释称,交互就是通过问答等交互手段帮客户达成目标,内容则主要通过生产短视频、图片、直播等形式达成。
这些目标包括降低闲时直播的成本并提高效率,以及在企业营销赛道上扩展新的边界。
因此,百度的数字人业务主要聚焦三个赛道:直播带货场景,企业营销(主要做新客户的转化、留存等),以及一些娱乐主播方向的事情。
其中落地最快的当属直播场景。百度表示,即将在2022年百度世界大会期间推出的数字人直播制作平台,能够实现24小时纯AI直播,数字人可以随意切换妆发、场景和造型,大量中小商家通过平台创设自己的直播带货数字人主播。
直播带货虽已成为商家重要的营销形式,但成本并不低,需要承担场地租用、雇主播以及整个运营团队的费用。
百度曾做过一项调研,在一线城市雇一个比较好的主播一般月薪在1万块左右,场地费用一年3-4万,即便抛去运营团队费用、补光灯和导播台硬件设备费用等等,每年也至少需要15万元,对于中小品牌来说负担比较大。
“有了我们这个直播平台,一个软件就能解决问题,成本下降了30%甚至50%以上。”李士岩表示。
不过,做数字人直播平台,还要克服很多技术难点。比如在人像维度,百度已经迭代了三个版本,借助于超写实数字人SaaS软件、超智能问答对话系统,以及口型合成技术、面部绑定技术以及动作系统,包括口型合成准确率目前达到98.5%。
在至关重要的交互能力上,百度将语音、语义和视觉等能力集成到一款产品上,不仅需要底层技术的突破,也需要非常强的工程化能力。
“我们相信经过持续努力,非常有机会在1-2年内让数字人的表现力和交互能力,无限制趋近于真人的水平。”李士岩表示。
官方信息显示,目前百度智能云曦灵已经拥有几十家客户,包括今年冬奥会央视总台的实时播报手语主播,与国家航天局合作的火星车数字人祝融号,以及国内首个文博虚拟宣推官“文夭夭”等,都基于该平台进行设计、研发、集成和应用。