对抗仇恨言论 Facebook推出看得懂表情包的新AI系统

2018-09-12 | 浏览：

作者：王毓婵

Facebook 宣布开发出了一款名为 Rosetta 的新型人工智能（AI）系统，可用于检测图片和视频帧（video frame）中的仇恨性言论。

对于 Facebook 来说，他们面对的是每月 22 亿用户发布的浩如烟海的信息，这其中不仅有文本，还有图片、视频、表情包等等——仇恨言论可能会在其中以任何形式出现。Facebook 称，Rosetta 可以读懂图片和视频帧上的影像和文字，分辨其是否是违反 Facebook内容审核指南的内容。

Rosetta检测示例图来源：Facebook

Rosetta 检测示例图来源：Facebook

Facebook 官方展示了一张示例图。在检测一张印着“企鹅会飞”（penguins can fly）的文字的企鹅图片时，Rosetta 将文字与图像区分开来，并使用卷积神经网络来识别和转录两部分的内容，最终判断出这是一张“表情包”（meme）。

对于一直因难以有效控制仇恨言论传播而饱受指责的 Facebook 来说，这一系统的推出将有助于缓解其燃眉之急。

自 2015 年以来，Facebook 一直在使用一种名为光学字符识别（OCR）的检测系统，但 OCR 在检测仇恨言论的能力上稍逊一筹。具体差在哪，从 Facebook 今年 5 月公布的《社区标准实施报告》结果中就能看出。

这份报告公示了 Facebook 今年一季度删帖、封号的记录。在他们删除的所有内容中，“裸体和性”占到了 72.7%，“图片暴力”占到了 11.8%，而“仇恨言论”只有 8.7%。

一季度受到 Facebook 处理的仇恨言论只有 250 万条，是所有类别中数目最小的一个。而且，其中 Facebook 自主检测的内容只占到了所有被标记内容的 38%，有超过 60% 的内容需要靠用户举报来发现，让人怀疑是否有更多的内容还隐在暗处未被揪出。

这其中的原因，一部分是因为“Facebook 的人工智能系统目前仍然难以辨别言论中的仇恨情绪。”Facebook 产品管理副总裁 Guy Rosen 说。另一部分原因是 Facebook 上的仇恨言论本身可能并不那么显而易见。

今年 4 月，Facebook 上的一些不实信息助长了斯里兰卡佛教徒和穆斯林之间的冲突。罪魁祸首其实往往是一些带有煽动性质的谣言，起初可能和仇恨与偏见并无瓜葛。内容本身已经足够具有迷惑性，更不用说 OCR 能够理解的语言还非常有限，在很多小语种地区 Facebook 还需要依赖当地人工审查员来分辨内容。

马克·扎克伯格在国会证词中表达了将来使用 AI 来清除其平台上的仇恨言论的计划：“我乐观地认为，在五到十年的时间里，我们将拥有一些人工智能工具，可以深入了解不同类型内容的语言细微差别，以便更准确。”

Rosetta 就是在此关头临危受命的 AI 系统了。据 Facebook 介绍，这一系统同时适用于 Facebook 和 Instagram，每天可以检测十亿张图片，并识别除了英语和拉丁语系以外的语种，比如阿拉伯语和印度语等。

目前，Facebook 和 Instagram 团队已经开始使用 Rosetta。该公司计划继续增加它可以理解的语言数量，并使其能更好地从视频帧中提取文本。

说到语言，Facebook 最近还为其自动翻译服务增加了 24 种新语言，包括塞尔维亚语，白俄罗斯语，马拉地语，僧伽罗语，泰卢固语，尼泊尔语，卡纳达语，乌尔都语，旁遮普语，柬埔寨语，普什图语，蒙古语，祖鲁语，科萨语和索马里语。Facebook 称，这些语言的翻译尚处早期阶段，可能会包含很多错误，公司正在完善它们，并会在未来加入更多语种。

TAGS：Facebook 表情包 AI