互联网高速增长的红利期结束,硅谷巨头们抢占家庭的硬件战争硝烟再起。比起中国互联网公司以强运营作为护城河,技术驱动的谷歌将如何走出自己的增长瓶颈?
文:刘泓君
编辑:宋玮
图为谷歌2019年开发者大会,当华盛顿开始声讨硅谷公司们的隐私问题时,科技公司的每一次发声都小心翼翼。摄影/《财经》记者刘泓君
图为谷歌2019年开发者大会,当华盛顿开始声讨硅谷公司们的隐私问题时,科技公司的每一次发声都小心翼翼。摄影/《财经》记者刘泓君
今年5月的谷歌开发者大会,谷歌用三天的时间发布了100个创新产品。距离谷歌从“移动为先”转型向“AI为先”的口号提出已经三年,可以说这场活动表现出人工智能的发展进入深水区,创新乏善可陈;也可以说它充满了人文关怀,细节才是打动人心的力量。
2019年是多事之年,就在谷歌开发者大会的前一周,由于其母公司Alphabet收入增长不及预期,财报之后大跌8%。对用户隐私的保护正在动摇用数据赚钱的广告模式,此外,谷歌收到欧盟17亿美元的天价罚单。此时,对硅谷科技巨头的反垄断与分拆讨伐不断,Facebook联合创始人发文建议分拆Facebook。今年,最后一批硅谷独角兽纷纷提交上市申请,互联网高速增长的红利期结束。
在中国和美国关系紧张下,谷歌断供华为手机,安卓系统成为中国和美国冲突升级的棋子,甚至连美国用户也对谷歌的“不作恶”提出质疑。
在整个大环境中,这场开发者大会的情绪与传递的信息都甚为微妙:过去五年,谷歌人工智能方面的重大技术突破,掀起沉寂许久的人工智能再次迎来高潮期,且诞生了一批独角兽;放眼未来,越来越多的模型需要大规模的数据来训练,当华盛顿开始声讨硅谷公司们的隐私问题时,这让科技公司的每一次发声都小心翼翼。
增长放缓、隐私忧虑,比起中国互联网公司以强运营作为护城河,技术驱动的谷歌将如何走出自己的增长瓶颈?这次开发者大会可见一二。
搜索无处不在
在谷歌母公司Alphabet的收入结构中,有84%以上营收来自于广告收入。然而,亚马逊正在广告市场蚕食谷歌的市场。
美国媒体CNBC曾经报道,在购物领域,广告主正在把预算从谷歌转移到亚马逊,原因是在亚马逊上投放的广告的投入产出比更高,越来越多人在购物时第一时间想到使用亚马逊来搜索。
根据市场调研公司eMarketer的预测,未来谷歌在广告市场的市场份额将从38.2%下降到37.2%,这1个百分点将被亚马逊取代,亚马逊在整个广告市场的份额将从2018年的6.8%上升到8.8%。预计2020年将达到10%。对未来谷歌在广告市场的担忧,以及一季度增长放缓,正是谷歌财报后下跌的主要原因。
长期来看,谷歌正在通过人工智能将搜索嵌入到更多场景中。《财经》记者在现场试用谷歌新发布的手机Pixel 3a时,拍摄一张照片,可以自动切换Google Lens(一款图片识别App),立刻会出现人物服装、家具等购买链接。这意味着,用户拍照都可以成为购物广告。记者现场试用结果显示,目前谷歌出现的相关图片购买链接,还无法精准到原物。
未来,依托谷歌的搜索技术,在加入图片与语音的交互之后,搜索不再只是输入文字。谷歌在开发者大会期间宣布了100项产品和算法上的新功能。这里,选取一些打动人的产品创新:
基于图片的搜索
美国绝大部分餐厅都没有图片,菜单是一张密密麻麻英文列表。当你去到一家餐厅不知道吃什么的时候,不需要再通过其他App搜索,打开Google Lens的手机摄像头对着菜单,屏幕会出现哪些菜最好吃,这些会有重点记号显示;当你点击一道菜的名字时,谷歌还会调取谷歌地图上的图片,直接出现这道菜的图片。
吃完饭后,只需要图片拍摄菜单,就可以自动计算AA制每个人应付的钱数。
此外,谷歌还与法国的一本美食杂志合作。当杂志上出现一道法式烤猪排时,只要用摄像头对着猪排的图片,就可以在摄像头中出现动态的猪排的做法演示。
尽管这些简单的小应用背后都需要强大的算法与技术支持,但这依然离不开谷歌过往收集的数据,比如菜单上的图片就来自于用户主动的拍照上传分享。而动态的猪排做法,则需要专业的团队去制作这样的视频。
基于图片识别的另一个功能是Google Go,它可以帮助识别路牌。对于语言不通的人来说,或者残障人士,只要将手机摄像头对准路牌,就可以自动将信息念出来,或者将英文信息翻译成中文,不再需要在文字搜索框内翻译,过去几年,谷歌在翻译功能和视觉识别的精准度方面已经快速提升。
在搜索具体名词时,谷歌还加入了3D图像与AR图像。在谷歌中搜索一双新百伦的鞋子,可以看这双鞋子的各个侧面,包括鞋底的展示。目前,谷歌正在与NASA、新百伦、三星、沃尔沃汽车和美国超市Target、美国家具平台Wayfair合作,在搜索结果中呈现更多3D图像。
如果搜索白灰鲨鱼,会在手机上出现鲨鱼的3D图像,还可以使用点击移动功能。现场展示者就将大鲨鱼的AR图像移动到了舞台上。转动摄像头,甚至可以通过手机看到大白鲸的牙齿。
Google Assistant语音助手
去年,谷歌首次推出智能语音助手的一款更加智能的程序Duplex,它可以模仿人的语气电话订餐、并且在机器说话的时候加入停顿词,可以连续发出多个请求,不需要每次都用“Hey Google”唤醒。谷歌资深科学家、技术大神Jeff Dean介绍称:“仅这一个系统就涉及了多项技术,包括自然语言处理和对话理解、语音识别、文本到语音转换、用户理解和有效的 UI设计。”
今年语音助手连续发出了8个指令,可支持多任务同时进行,甚至可以让语音助手挑选出相册中在黄石国家公园有动物的照片,甚至是有牦牛的照片。
谷歌还推出了基于网页的Duplex版本,只要说出为我下一次旅行订车,Duplex可以通过Gmail知道你喜欢的车型、订车时间,自动帮你完成所有需要填写的表单,全程不需要手动输入,这项功能将在今年下半年上线。
当你告诉语音助手:“导航去妈妈的家”,其中“妈妈的家”可能是一家餐厅的名字,也可能真的是你母亲的住所。谷歌可以识别这些个性化信息。
考虑到强大的“填表机器人”可能比用户更清楚地记得自己的信用卡账户、妈妈家的地址、航班和出行的详细订单,在隐私问题频繁出现的硅谷,需要用户自己在语音助手中设置个性化信息。
不过,这些新技术的展示就好比泡面盒子上的展示图片与真实图片的差距。在去年的现场展示中,Duplex在帮助人类订餐时,甚至可以模仿人的语气词,以至于餐厅老板也无法确认,背后到底是一个人还是机器人。
但在真实的应用中,谷歌承认Duplex有25%的电话是人打出去的,而不是真正的语音助手,在机器打出去的电话中,15%会受到人的干预。现场多数人在看完演示以后,会很简单地以为这个机器人无所不能,真相是,它最擅长的功能就是“预订餐厅”,因为谷歌一直在反复训练它,尽管如此,它有时候还做不到那么好。
今年,语音助手还将加入到谷歌地图中。只要说出“Let’s Drive”,就可以通过车内环境语音打开Youtube上的音乐、决定是否接电话。可以确定的是,通过语音直接调取应用程序越来越主流,语音正在成为下一个入口。
关爱特殊人群
谷歌的价值观是:“让所有人都可以享受技术的便利,而不是一部分人。”今年,谷歌也推出了很多使用科技帮助残障人士的新功能。最终,这些帮助残障人士沟通的新技术进展,也可以给普通人在特定场景下使用。
Steve Saling患渐冻症已经有13年,这种病在发病后肌肉僵硬、抽搐、说话或者吞咽困难,四肢开始逐渐无力,最终丧失自主运动的能力,著名物理学家霍金就患有此病。
谷歌通过识别Steve的面部表情,来训练机器学习的模型。最终他只需要稍稍做出不同的面部表情,就可以操作谷歌智能家居设备Google Home。
这个项目名为Project Euphonia,由失聪设计师Elise Roy与哈佛教授Michael Brenner共同研发,但它需要尽可能多的声音样本。
谷歌语音研究员Dimitri Kanevsky就是一名听力障碍者,失聪后才开始学习英文,因此在谷歌现场播放的大屏幕上,完全无法听清楚他在说什么——这段英语发音模糊,单词输出不清晰,无法与人沟通。于是,他录入了1.5万条自己的语音模型训练,最终,机器可以准确识别他的声音与讲话方式。但这种个例并不具有普适性,谷歌正在寻找更多的样本为残障人士提供交流渠道。
谷歌还研发有一项Live Caption系统:你所说的话字幕会实时出现在手机屏幕上,这样失聪的人就可以通过文字“听”到语音电话了。除了给残障人士使用,这项场景应用广泛,比如在嘈杂的酒吧看球赛或者电视(美国电视都不带字幕),或者不太方便收听电话时均可使用,语音可以实时转换成文字。
如今,这个功能已经在Youtube视频网站上应用,对于没有字幕的美剧,在屏幕下方点击字幕,就可以出现谷歌根据语音出现的字幕。但事实上,字幕的实时识别并不是什么新功能,美国的用户很早就可以选择在Youtube上添加字幕了。一位现场的开发者很明显地感觉到:“谷歌的识别准确率提升很快。”
在互联网时代,谷歌的第一次商业模式是通过搜索卖广告赚钱;在移动时代,谷歌抓住了安卓的机会。如今,谷歌正在通过图片与语音的识别技术,改变搜索的方式,并将人工智能悄无声息地嵌入更多场景中。
硬件战争
语音与图片技术的发展也在带来用户使用习惯的改变。拍照是搜索,说话是搜索,看菜单、订车都可以是搜索。在硅谷,很多人使用智能手机的习惯已经改变:“Hey Google,明天早上8点开会。”“Siri,打开微信。”他们习惯对着安卓或者苹果用语音打开手机应用程序,而不再是滑动屏幕找APP。
过去,智能语音助手在五大科技巨头之间角力并不是什么新鲜事:苹果的Siri、亚马逊的Alexa、微软Cortana,以及Facebook的Massager M和Google的Assistant,这些各大公司研发的语音助手,都在寻找落地场景。在语音产品上,过去两年竞争最激烈的新硬件领域就是智能音箱。
Google Assistant是软件,Google Home是智能音箱硬件,Duplex又是Assistant软件中的一个Google开发的语音应用程序;同时语音助手也可以调动很多其他应用程序,可以看成是语音小程序Actions。
在智能语音市场上,除了发布手机之外,家庭智能硬件的竞争越来越激烈,过去主要是谷歌与亚马逊的较量。亚马逊最先行动,从2014年开始开发智能音箱,尽管技术上不如谷歌,但一直牢牢占据着过半的智能音箱市场。2016年之后,谷歌醒过来开发智能语音助手。过去三年的谷歌开发者大会,谷歌语音助手抢占了主题演讲最多的风头。
一位同时使用过谷歌与亚马逊智能音箱的开发者评价称:“亚马逊的智能音箱发行比较早,能够控制的智能设备更多;但谷歌智能音箱的技术更好,在一些开放性问题的回答上,明显智能很多。”一位房地产销售人员称:“在谷歌公司旁边的新楼盘,已经在房子里内置了亚马逊Alexa,用来遥控家里各种设备。”
2018年,是谷歌逆袭的关键一年。它用29.9美元低价的Google Home Mini智能音箱抢占尽可能多的智能家居市场,谷歌很快将市场份额从23.8%提升至29.5%。Voicebot研究机构曾经预言,到2022年,预计谷歌智能硬件产品将超过亚马逊,形成48%比37%的市场格局。
早期,谷歌语音助手内置于谷歌Pixel手机中,后来还出了iOS与安卓的App。接下来,谷歌将语音助手应用于开发的两款智能音箱产品中:Google Home与Google Home mini。如今,谷歌的新算法可以帮助新一代的智能助理在设备上以高达10倍的速度来回答问题,延迟几乎为零,新一代的智能语音助手将出现在今年晚些时候推出的Pixel 3手机上。
未来,谷歌还将与汽车厂商合作,在更多汽车上安装语音助手。当你在驾驶时,谷歌语音助手可以开启智能驾驶模式,新的仪表盘会在开车时自动启动,通过语音控制导航、信息和电话、多媒体。除此之外,甚至还可以用它远程控制汽车,比如调节车内的温度、检测燃油油位,或者在房间里锁车。
另一个趋势是,在智能音箱布局完成以后,硅谷巨头们纷纷酝酿以客厅和厨房为中心的带显示屏的智能设备。一位谷歌工程师告诉《财经》记者:“有很多场景无法通过语音来解决,语音在识别上还有一些误区,屏幕的存在可以帮助纠正声音指令,也会有更多的应用场景。”
今年的几个开发者大会上,谷歌发布了带有屏幕的Nest Hub,它可以给家人打电话、看美剧,尤其适合厨房与家庭硬件设备。Facebook也发布了适合厨房与客厅的硬件设备Portal,但在语音助手的合作上,普通的应用场景Facebook选择了自己的语音助手,而购物场景则与亚马逊Alexa合作。
谷歌从2016年开始研究语音助手,2017年推出了基于语音助手调动的小程序Actions。2017年4月,谷歌还仅仅只有175个Actions,到如今已经有4253个Actions。与之对比,亚马逊有6万多个Skills小程序。
在谷歌的园区,语音助手的体验区会详细教开发者如何来设计基于声音的交互。经过近四年的发展,谷歌将语音助手如同第三方设备一样,开放给很多第三方合作伙伴。目前,已经在超过10亿台设备、在80多个国家以30多种语言开始使用。
谷歌CEO SundarPichai在活动一开始就展示了现场的AR地图和导航功能,这让这次开发者大会看起来像一个充满未来感的乐园。
这样的AR导航对找不到方向的人来说提供了很多便利。记者在现场打开AR地图,除了经常掉线跳出,在不到两分钟的时间里,手机电量从31%掉到了15%。尽管谷歌每年的开发者大会演示的新功能都很炫酷,应用到现实还有很多要解决的问题。
新技术应用困境也是谷歌商业探索的折射,很多新的商业模式起源于细分领域的技术突破,这是长期探索的过程,短期内还要克服很多难题,无人驾驶Waymo的诞生就是个典型的例子。
这正如独立股票研究机构Valuentum Securities分析师CallumTurcan所说:“Alphabet的公允价值被下调,部分原因是该公司进入了收入增长放缓期;但我们非常乐观地认为,Alphabet是一个长期投资机会。”