首页 > 国内新闻 > 正文

GAITC专题论坛丨张俊林:AI时代下大规模机器学习的应用

原标题:GAITC专题论坛丨张俊林:AI时代下大规模机器学习的应用

7月26日,由中国人工智能学会主办、新浪新闻联合浙江大学承办的2020全球人工智能技术大会(2020GAITC)“AI时代下的新媒体与社交娱乐”专题论坛拉开帷幕,新浪集团首席信息官、新浪AI媒体研究院院长王巍,浙江大学特聘教授、悉尼科技大学教授、百度研究院访问教授杨易共同担任论坛主席。

新浪微博机器学习团队AI Lab负责人张俊林本次专题论坛上,与来自业界、学术界的嘉宾们分享了《机器学习在微博的应用》。

图注:新浪微博机器学习团队AI Lab负责人张俊林作主题演讲。

图注:新浪微博机器学习团队AI Lab负责人张俊林作主题演讲。

张俊林提到,在新闻场景中,或者微博场景中,实时模型的在线学习非常重要。用户兴趣可能会非常快速的发展变化,尤其是在视频的场景下。作为机器学习模型,如何更快捕获到用户行为、兴趣的变化?如果把兴趣点体现到模型中,并实时更新,那么再做下一刷的时候,新兴趣可能就体现出来,这就是所谓的实时模型。

他认为,在当前日益激烈的竞争环境下,以大数据+深度模型的新技术对于推动用户进一步增长非常重要。

以下为张俊林演讲实录,内容经编辑略有删减:

尊敬的各位嘉宾,网上的朋友大家好,首先我个人非常感谢论坛主席能够提供这么好的机会让我来给大家分享一下人工智能在微博中的应用。

大家都知道,新浪新闻和新浪微博,应该说是我们公司在AI时代下大环境的变迁情况下两个典型的个性化的应用。在这种个性化的推荐场景下,怎么去应用AI技术,哪些是它最需要的技术点,包括我们做了一些什么,今天我主要分享这些。

我主要从下面三个方面来给大家汇报和介绍一下,首先简单说一下所谓人工智能的发展趋势,我主要是从技术的角度讲,王巍总刚才高屋建瓴的把新媒体讲的非常清晰,接下来我将从技术的角度来阐述一下,然后我们会介绍一下AI在微博中主要的应用场景。最关键的可能是在第三部分,我们到底在哪些场景,或者采用哪些技术这是一个关键点。

从技术发展趋势来说,由于媒体的新时代是人工智能广泛应用的时代,后面会介绍几个技术发展趋势,而造成这种趋势的根本原因是什么?首先我觉得最根本的可能是在新时代下,媒体的发展类型由原来的PC端的大众传播到现在的手机成为我们每个人必备的一个工具,到未来的IOT,万事万物都会产生新的数据。这意味着每个人可以随时随地把所见、所想、所听传播出去,每个人都是一个信息制造者和传播者。

另外一点,我们拥有世界最领先的5G技术,这代表了我们网络带宽速度更快了,成本更低了,这可能是最根本的一点,导致了一个新的数据形态,代表了每个人都可以随时随地发信息,信息极度爆炸,另外一点,因为手机现在拍照片,拍视频都非常的简单,非常的方便,所以就产生了很多媒介类型。

我们用微博来说,微博上媒介类型的变迁是非常明显的,目前微博app上70%的微博是包含图片的,30%的微博是包含视频的,我们可以看出它的发展趋势。这一点,从技术的角度上看,是上述这些原因导致了技术的发展。下面简单介绍下几个技术发展趋势:

首先第一个图象理解,刚才我们讲了图象占微博70%,如果你想更好的理解用户,更好的理解内容,能够看懂一个图象在讲什么,理解它是非常关键的。还有两个具体的例子,人脸和物体的识别,我个人觉得图象理解非常的重要,但是从目前的成熟度来说,任重道远。

对于机器来说,什么是真正理解一个图象,理论上来说我拍一张照片,里面包含的任何实体都能够精准的识别,比如一瓶水,一个讲桌,甚至是水的品牌我应该都能识别。但是现在达到这一点,我个人觉得可能有困难,这是由于目前的技术成熟度,还不够导致的。但是这个大方向,毫无疑问是很重要的一个方向。

然后相关联的是视频理解,我们刚才讲的视频现在占了互联网流量的相当大的一个比例,你如何理解一段视频在讲什么,是什么场景,发生了什么,对于你正确的理解用户,理解一个内容是非常关键的。同样的,刚才杨教授也讲到了,真实生活场景里面的视频,你会发现非常的复杂,各种场景都会有。你怎么定义它,怎么识别它,实际上是非常困难的事情。

刚才各位老师也说过了,多模态的事情,目前来看是非常重要的。比如拿微博来说,你发一条微博时就包含了4到5种模态信息,包括发的文本内容,图片内容,视频内容,包括发布者的信息,包括社交关系,这都是不同的媒介类型。我们能够怎么集成所有的不同媒介的类型,更好的理解一个内容,更好的理解用户,这是非常关键的一个点。

另外,无监督学习也是发展趋势。无监督的学习,实际上最近从2018年下半年开始热起来,根本的一个促进它热起来的一个点,就是Google提的Bert,是典型的利用无监督来促进技术发展的一个飞跃性的技术。

为什么我们要无监督学习?因为机器学习实际上模型是一方面,更关键的一方面是训练数据,因为你要教机器去学习知识,那么你得告诉它,先给它一些样例,让它从样例里面去学知识。但是你做大量的训练数据,就要花费很大的人工成本,这就是过去限制机器学习一个非常重要的因素。

那么无监督就是缓解这个问题,意思就是说,我们能不能让机器从大量的自然语言文本里面自动学到很多的知识,无监督做这个事情,这应该是引领性的一个模型。

另外一个趋势,实时模型,学术上一般叫做在线学习,这在我们新闻场景,或者微博场景是非常重要的。我们要捕获一个用户的兴趣,用户的兴趣可能会非常快速的发展变化,尤其是在视频的场景下。那么你作为机器学习模型,怎么能够更快的捕获到用户行为的变化,或者兴趣的变化。实时模型就是干这个事情的,比如说我们用户在刷微博,随着一刷一刷,看我过去10分钟新点过什么东西,可能新点的东西就代表了你新的兴趣。我们希望你能够尽快的把兴趣点体现到模型里面去,更新这个模型。那么在再做下一刷的时候,新兴趣可能就体现出来,这就是所谓的实时模型,对于目前,尤其是对于短视频的场景,在线学习是非常重要的一个点。

最后一点,超大规模算力,这个应该是对互联网公司来说,是非常关键的一个事情。因为我们知道,对于互联网公司来说,用户量非常大,日活、月活都是以亿计的,那么当大量的用户来使用这个产品的时候,快速的进行相应推送,是非常关键的。大家看到的每个人上去刷,不太容易直观感受到这一点,但是如果你考虑到每时每刻有数亿的用户同时在刷一个东西的话,后面实际是有几千台甚至是上万台机器来支撑这件事情的。所以大规模的算法对于机器学习非常重要。

上面介绍几点技术发展趋势,我刚才介绍这些是为了引出第三部分,因为我们做技术布局也是围绕技术发展趋势来做的,只有这样的话,我们才能事半功倍来做这个事情。

第二板块介绍一下涉及到的应用场景,这是我们整体的一个基础架构图,最底层应该是机器学习的架构,比如说对于微博场景,我们有成亿的数据和用户,那么对于这么大的数据怎么能够快速收集、存储、简单的处理。你需要训练一个机器学习模型,我们现在是一线的互联网公司,训练一个机器学习模型,规模是非常恐怖的。基本上规模达到了百亿级的特征,训练数据是千亿级。

刚才我们还要支持实时模型,你能不能尽快的推动大量的机器,把这些模型训练出来,底下的机器学习架构实际上干这个事情,中间是算法层,是围绕应用场景来布局的,我觉得如果对于我们的应用场景来说,可以归纳为一个中心,两个基本点。

一个中心是个性化推荐,怎么能够更精准的推信息,这个是中心。你为了能够做好更好的推荐,两个基本点。第一点,你要理解内容在讲什么。第二点你要理解用户对什么感兴趣,只有这两个基本点做好了,我才能做好推荐这个事情。可以说所有的都是围绕这个事情布局的,所以你看算法,推荐还是比较核心的一个点。包括你想要理解微博或者新闻在讲什么,你要理解文本,自然语言处理,你要理解图片、视频、计算机视觉,甚至是语音,这个是围绕这个事情来布局的。最上层就是我们要支持的各方面、各种应用。

这是目前我们机器学习支持的核心业务,打出了一个时间轴,从这儿我们可以看出来,机器学习在微博也好,新闻也好,个性化推荐也好,起了越来越重要的作用。从早期的支持个别业务,到目前支持大大小小10多个业务。

在这些应用场景里面采取了哪些技术,第三部分主要来跟大家分享一下这部分的内容。如果归纳一下微博的内容生态的话这个图展示了三个环节,首先内容生产,应该都是用户内容,但是你从技术的角度来讲,我们希望能够让用户成本更低,更便捷的生产一个微博。

实际上我们目前的技术核心,投入比较多的是后面两个环节,首先是内容理解,你怎么理解一个微博在讲什么,你怎么理解一个用户对什么感兴趣。其次是内容消费。我刚才讲的推荐部分提到了怎么能够提高分发效率,让更多的用户,更快的获得到你感兴趣的内容,这样就形成了一个完整的闭环。后面我介绍一些具体的技术点,内容消费分发就是我刚刚讲推荐那部分的应用。核心包括两侧和一个桥梁,两侧中的第一侧我们首先要理解内容在讲什么东西,因为微博的内容类型非常多,比如说微博、视频、图片、文章、话题很多,第二,我们要理解每个用户对什么感兴趣,中间这个桥梁就是推荐系统。根据用户对什么感兴趣,我从里面筛出海量你可能感兴趣的,推送给你几十条,因为每个人的消费时间是有限的。

下面我们归纳一下推荐技术的进化逻辑,这个图展示了推荐技术的进化方向,应该说不仅仅是微博,或者说我们新浪体系,业界所有的做个推的公司,基本上都是按照这些历程去做的,最早的就是LR,大规模的LR模型,到FM模型,再到在线FM模型,到目前的深度学习排序,目前我们新浪体系也是走在深度学习这一侧。

我们除了把最新的推荐技术落地之外,也积极的推出了一些新的技术。包括我们落地对外提供了一些知识的分享,我们去年在推荐领域最好的一个国际会议发表了一个新模型Fibinet,这个应该是目前效果最好的深度模型之一,据我所知,有一些互联网公司开始应用这个模型去做个性化推荐。

刚才讲的是推荐,还有两个比较关键的中心点,理解内容,理解用户,从理解用户来说。精准的用户画像是做好推荐的一个基础工作。在我们微博内部,对每一个用户在后台都对他的个人兴趣做了一些挖掘,挖掘的属性实际上有很多,从很多种维度来进行挖掘,包括个人的兴趣爱好,能力,包括你的自然属性,性别年龄这些都有很多。

后面我们介绍一些内容理解,比如说图片理解,这是一个在微博环境中非常有价值的一个信息,明星可以说在微博上是占有一定流量的,现实中面临一个问题,你要理解一个图片,比如说这个图片出现了一些明星,你能不能正确的识别出这个明星是谁。目前我们能够支持大约600多个明星的识别。

另外一个图片理解的应用场景,看上去很简单,但是效果产生的影响非常大。我们说的智能裁剪,我们现在都是用手机来浏览信息,但是往往我们每个微博会有4图、5图、9图,当9个图时你是不可能把每一个图完整的展现出来,只能展现一个小窗口。那么一个图展现窗口,展现哪一部分,对于用户是否会点击它,影响非常大。

举个例子,比如说这张图片里的杨幂,你可能发现最关键的脸部信息被减掉了,体现给用户的体验不太好。此时我们就可以用智能裁剪,对图片里面最显著的部分检测出来,然后展现小窗口的时候展现显著部位,就像图里面展示的一样,这就对流量产生了非常大的推动作用。

另外一点,这个主要是围绕多模态的角度讲的,我们需要对文本进行理解,需要对图片进行理解,文本理解的话,微博主要是从几个维度来做,包括内容类别,分为体育的、娱乐等,我们目前有三级体系。包括微博是否有吸引力,时效性如何,质量如何,垃圾广告等各种维度的分析甚至图片也有各种的分析,然后集成到一起,通过模型来更好的理解一个微博在讲什么。

视频我们讲现在有30%的微博带视频,如何更好的理解视频,非常的重要,我这列了一下我们目前做的一些工作,包括对视频来源的识别,对场景的识别,我要知道视频讲的是体育的,还是娱乐的,如果包含明星,是哪些明星,只有这样识别,我们在做推荐的时候才能更精准的推荐。

这给了一个多模态的例子,多模态确实越来越重要,我们在一线做这个事情会体会的特别的深。举个例子,多模态是怎么发挥作用的,单纯从文本来说,一个用户发了微博说这几个苹果哪一个好,我们知道苹果是多意词,可能是吃的苹果,也可能是手机,还有可能是电影电视剧。你如果单纯的分析文本,很难知道用户到底在讲什么,但是带着图片,通过图片的分析我们知道实际上讲的是手机,就可以更精准的理解用户的兴趣,这个是比较直观的例子来说明多模态的重要性。

最后我说一下内容生产,生产主要是为了辅助用户能够更低成本的产生一些内容,也包括保护一些用户隐私的保护。具体举例,比如做语义分割,把用户的背景照片替换掉,你可能不太愿意把你真实的背景展现出来。我们可以根据需要替换掉变成你想要的背景

这是我今天的分享,感谢大家。

责任编辑:刘光博

全国侨联第四届主席庄炎林逝世,享年98岁 员工接连出现确诊病例,大连凯洋海鲜被按下"暂停键"