原标题 Facebook“十年挑战”只为忆往昔?
来源 猎云网
编译 桃子
注:“十年挑战”是最近外网很火的一个活动,网友们纷纷晒出自己十年前后对比照。与此同时,这一做法引发了作者的思考。她认为在各种技术发展的今天,这种做法看似无害,但可能存在隐患,上传照片所建立的大量数据会帮助进行面部识别算法的训练。
如果你有使用社交媒体,你可能会注意到Facebook、Instagram和Twitter上出现了一种新趋势,用户会晒出自己以前和现在的对比照,大部分是展示自己十年前和现在的照片。
我没有参与,而是发了一条带有讽刺意味的推文。
这条推文引起了一些关注。我并不是想说“十年挑战”本身是危险的,不过我知道,面部识别的场景大体上是可信的,并且表明了一种用户应该意识到的趋势。我们毫无保留地分享个人信息的深度和广度仍值得考虑。
许多反驳我的网友认为,反正照片已经存在了。最常见的就是:“这些数据是可用的,Facebook已经获得了所有的个人资料照片。”
他们当然是这么想的。在各种版本的“十年挑战”中,网友们将自己的第一张个人资料照片与当前的放在一起,或者将十年前自己的照片和现在的放在一起。因此,这些照片的确是存在的,上面有上传时间。很多人上传了大量的个人照片,且大部分是可以公开访问的。
让我们把这个想法付诸实践。
想象一下,如果你要得出一个与年龄有关的面部识别算法,更具体地说,是年龄增长(例如:随着年龄的增长,人的外貌会如何变化)。在理想情况下,你希望有一个包含大量人物照片、广泛且严密的数据集,而这种挑战正好准确地告诉你这两张照片的时间差——十年。
当然,你可以在Facebook上浏览个人资料图片,查看发布日期或EXIF数据。但这可能会产生一些误解,用户在发送照片时并不是一直按照时间顺序,发的照片也不一定都是本人。快速浏览我Facebook好友的资料图片,可以看到一个朋友刚去世的狗、卡通人物、文字图像、抽象图案等等。
也就是说,如果你有一组简洁,标有“过去”和“现在”的照片,就会有所帮助。
此外,Facebook个人资料照片的上传日期不一定与拍摄日期相符,即使是照片上的EXIF元数据在评定该日期的时候也会出错。
为什么呢?因为人们可以浏览离线图片,数年间,他们可能多次上传过图片。有些人会上传在其他地方找到的截图。一些平台为了保护隐私会去除EXIF数据。
人工智能有线指南
紧跟Facebook的这一趋势,很多人在照片上添加了文字(例如:“2008年的我,2018年的我”),还有更多信息,大部分是拍照的地点和方式(例如:“2008年于某某大学,由Joe拍摄;2018年到New City参加某某活动”)。
换句话说,多亏了这个挑战,人们才精心整理了十年前和现在的照片,这是一组非常庞大的数据。
当然,我在Twitter上收到的恶评并非都与照片的可用性有关。一些网友指出垃圾数据太多了,不过数据研究人员和科学家知道怎么解释这一现象。和热议话题一样,早在人们开始为了不相关的目的参与或试图控制话题之前,你就可以更加信任趋势或活动数据的有效性。
至于伪造的图片,图像识别算法足以识别人脸。如果你上传了一张猫的十年前后的照片——我一个朋友就这么做了——这种样本就很容易被丢弃。
更重要的是,即使这种话题不是社交工程的案例,但过去几年已经充斥着各种社交游戏和话题的案例,目的就是提取和收集数据。想一想剑桥分析公司(Cambridge Analytical)对七千多万美国Facebook用户提取的海量数据就知道了。
有人可以用你的Facebook资料照片进行面部识别算法训练并不一定是坏事,有些时候这是不可避免的。更广泛的结论是,我们需要处理与技术的互动,关注我们生成的数据以及如何大规模地使用它。我会提供三种貌似合理的面部识别使用案例:有效的,普通的以及有风险的。
有效的案例:面部识别技术,特别是其年龄增长算法,可以帮助寻找失踪儿童。去年,印度新德里警方报告称,利用面部识别技术,他们仅用了四天时间就找到了近三千名失踪儿童。如果这些儿童已经失踪了一段时间,他们看起来也许会和最近一次拍的照片有所不同。因此,一个可靠的年龄增长算法在这里可能真的会有帮助。
面部识别的潜力大多很普通,年龄识别可能最适用于目标广告。广告显示屏里加入了摄像机或传感器,能够根据不同年龄段的人口特征(以及其他视觉上可识别的特征和可辨别的文本)来修改信息,这种显示屏可能很快就会普及。这没什么可激动的,这种应用只是为了让广告的目的更加明确而已。但随着数据扩散,它与我们的定位、和购买行为以及其他信号交织在一起,可能会带来一些令人不寒而栗的影响。
和大部分新兴技术一样,也存在一些令人担忧的后果。年龄增长可能会成为保险评估和医疗保健的一个因素。如果你看起来比同龄人老成,投保风险也就更大,你可能要支付更多或被拒绝投保。
亚马逊在2016年末推出了实时面部识别服务,之后便开始向执法部门和政府机关(如奥兰多和华盛顿县的警察局)销售这些服务。不过这项技术引发了重大隐私问题:警察不仅可以用这项技术追踪犯罪嫌疑人,还可以追踪那些没有犯罪的人,比如抗议者或其他被警察视为眼中钉的人。
美国公民自由联盟(The American Civil Liberties Union)要求亚马逊停止出售这项服务,亚马逊的部分股东和员工也以公司的估值和名誉为由,要求其停止这项服务。
我们很难夸大技术对人类的影响。我们有机会让它变得更好,为此,我们也必须认识到它可能会变得更糟。一旦了解了这些,我们都不能置身事外。
这有什么大不了的吗?就因为传了一些已经公开的照片,糟糕的事情就会发生吗?用年龄增长和年龄识别进行面部识别训练是危险的吗?不完全是。
不管这个话题背后的起源或意图为何,对于我们创建和分享的数据,授予它的访问权限以及其含义,我们都必须变得更加精明谨慎。如果是在一个游戏中,它明确说是在为年龄增长研究收集过去和现在的照片,那么你就要考虑清楚谁能够以及为何目的看这些照片。
从任何一个话题或者社交平台的细节中,我们能看到更为广泛的信息,那就是人类是世界上大多数技术最丰富的数据来源。我们应该知道这一点,并且继续保持谨慎和沉稳的态度。
人类是连接物质世界和数字世界的纽带,人类的互动是使得物联网有趣的主要原因。我们的数据是使企业更智能、更有利可图的动力来源。
我们应要求企业无论如何都要给予我们的数据应有的尊重,但我们也需尊重自己的数据。