首页 > 互联网 > 正文

数据生意左右手互搏:打破数据孤岛,保护隐私安全

作者邱智丽宁佳彦

通过贩卖8亿人的信息数据获得4亿元营收,招聘数据公司巧达科技的灰色数据生意,让大众看清了精准营销数据变现背后的把戏。越来越多的公司在掘金大数据市场,但数据低质问题、数据孤岛和数据安全成为掘金路上的“绊脚石”。

破除信息孤岛,提升大数据服务的有效性,通过大数据来改善企业的经营情况以及合规使用大数据避免碰触行业底线,成为大数据服务的新议题。

权衡:数据孤岛vs风险管控

过去的一段时间风控行业可谓冰火两重天。

“理财用户获客成本在500元左右,甚至暴涨到上千元,贷款用户的注册成本也在40元左右,有些平台一天就砸下几百万来获客引流。”一位金融行业从业者告诉第一财经。

流量成本的急速拉升,使得互联网金融行业越来越意识到风控的重要性,它们希望借助技术将风控前置,来降低获客成本,实现真正的精细化运营。另一方面,很多所谓基于数据的短期小额贷项目,借助大数据技术摇身一变,成为面向特殊人群的精准高利贷,从而走到灰色地带。大数据黑产业链牵连出的数据隐私和使用边界问题,让不少用户对大数据闻风色变。

针对大数据风控有效性不足问题,第三方征信公司商安信董事长陈晓东告诉第一财经,根本原因依旧是数据孤岛导致的信息不透明、不对称和不及时问题。“目前信息资产散落在政府、银行、互联网金融企业和第三方征信公司手中,因为涉及各方利益问题,以及每家掌握的数据维度、格式和完整度不尽相同,信息很难在短时间内互联互通。”

据了解,目前反欺诈一个重要的识别就是行业黑灰名单。黑名单来源于民间借贷、线上P2P、信用卡公司、小额借贷等公司的历史违约用户,另外一个主要来源是催收公司。灰名单是逾期但是还没有达到违约的客户,灰名单还意味着多头借贷,申请人在多个贷款平台进行借贷,总借款数目远远超过其还款能力。

“对于互联网金融公司而言,这些都是靠资金和一次次‘被骗’积累来的数据,也是企业的核心资产之一,目前整个行业缺乏信息共享机制,各大机构并不太愿意分享。”上述金融从业人士告诉记者。

P2P爆雷现象只是中国企业失信黑海中的冰山一角。据商务部统计,中国企业每年因信用缺失导致的直接和间接经济损失高达6000亿元,金融机构的不良贷款余额持续增加,另据银监会发布的数据,去年三季度末,商业银行不良贷款余额为1.67万亿元,商业银行不良贷款率达1.74%。

“企业的偿债能力自2010年开始一直处于下降趋势,去杠杆和GDP增长放缓导致亏损的民营企业数目和P2P破产大幅增加。”领沨资本创始合伙人、原高盛集团中国管理委员会成员马宁告诉第一财经。

基于这些判断,他所在的机构不投和中小企业贷款有关的P2P等,而是投资提升企业信贷风险管理和供应链风险管理的公司。“商业活动日益活跃,需要更加复杂、实时的信用评估与风控服务,移动科技和数据红利为消费金融和金融科技公司的发展提供了支持。”马宁表示。

举措:开放共享和AI赋能

如何破除信息孤岛,增强数据检验能力,提高数据质量和可靠性,通过大数据来观测企业的经营情况,是一些数据服务公司目前正在努力探索的业务。

合合信息创始人兼首席执行官镇立新认为,数据孤岛是个老问题,作为世界金融中心的美国实现数据互联互通,也经历了漫长的过程。当下一方面要加强企业间的合作,拓宽数据采集的渠道,丰富数据的维度。另一方面要借助人工智能、字符识别、图像处理等技术来交叉检验,解决数据低质的问题。

为了拓展数据的深度,近日合合信息选择与商安信进行战略合作。前者的优势在于拥有国内1.8亿家企业和组织机构数据、覆盖743个维度及600亿条动态实时商业数据,能够全面分析企业经营状况。后者则专注于商业信用领域的数据处理、整合、评级、服务,拥有各项征信牌照资质及授权,以及庞大的国际企业数据库。

“在数据量巨大的基础上,通过合作我们加入深度的评级、判断,这是广度和垂直的结合,数据面更广,查询也更为立体,从而能够更好地识别企业信用风险。”镇立新告诉第一财经。

在镇立新看来,未来数据服务公司的发展壁垒并非收集、出售数据那么简单,更核心的竞争一定体现在数据处理能力上。据了解,启信宝曾通过数据抓取和对比,发现数十家公司的工商注册地、企业联系人以及贷款申请文件内容非常相似,最后发觉背后是一个骗贷团伙。“借助人工智能技术,通过数据清洗和交叉验证,机器可以识别数据之间的联系,从而可以提供实时企业舆情和监控服务。”镇立新表示。

数据孤岛问题在办公服务软件领域也同样存在。

越来越多企业的运转离不开云端上的各个办公服务软件,但是这些软件商所分类存储的数据库通常保持独立,构成了一个个的“数据孤岛”,很难把数据的价值最大化。

“我们的客户都在尝试通过整合行为、CRM、ERP和其他内部数据组以更加全面地了解每个消费者,而如今,他们所面临的挑战就是如何整合这些数据。”传播集团WPP首席技术官斯蒂芬·普里托里斯(StephanPretorius)表示。

为了帮助企业在已有的孤立数据孤岛中建立联系,Adobe、微软、领英选择联手,推行开放数据计划。通过三方合作,分析企业与它们的客户在不同软件上的互动情况更加深入地进行大数据分析。

这样的开放数据计划致力于通过通用数据模型将数据存储在共同的数据湖当中,从而提高三方应用和平台的互操作能力。同时,统一的数据存储方式能够允许客户自主选择开发工具和应用来构建和部署服务。

数据隐私边界

伴随数据的共享和开放,以及大数据的深入应用,商业信息和个人隐私之间的边界也越来越模糊,如何合规运用大数据,避免碰触行业底线?

合合信息旗下包括名片全能王、扫描全能王、启信宝等多款产品,直接涉及用户个人和企业商业信息,镇立新认为虽然更多的数据有助于改进信用评估的效率和准确度,但技术公司采集数据过度就会侵犯用户隐私,这涉及企业的商业化选择问题。“在收集数据的过程中,我们只使用公开信息,并确保内部数据脱敏,个人隐私数据百分之百需要保护,一个底线是不能将隐私数据用作广告销售。”

在博鳌亚洲论坛2019年年会上,苹果全球副总裁葛越也表达了同样的观点,她认为数据最好的使用,是为用户提供更好的产品体验,而不是把用户数据卖给广告公司。

“数据存在你自己的设备上,设备放在你自己的口袋中,你锁上自己设备的时候,你的这些数据也被锁上了,所有这些数据都得到了很好的保护。即便你在云上备份的时候,也同样得到了保护,哪怕一个专业的工程师也没有办法获得用户的数据。”葛越表示。

对于掌握大量数据的企业而言这是最理想的状态,但包括谷歌在内的巨头依旧存在发送广告时缺乏透明度、信息不足,且未获得用户有效许可等问题。加利福尼亚州去年采取的一项具有里程碑意义的法律,旨在遏制Facebook、谷歌和其他科技巨头的数据收集行为。

该法规对科技企业做出一系列规定,包括企业必须披露它们收集的信息,消费者可以选择删除数据,企业也不能通过改变价格或服务水平进行报复,企业可以为被允许收集数据提供“财务激励”,同时加利福尼亚州当局有权对违规行为进行罚款。

如何权衡数据红利和隐私保护,该法规有不少借鉴意义。“数据安全非常重要,隐私保护是需要分层和分级的,这可以最大限度保障我们每个人能够享受数据带给我们的便利。”科大讯飞高级副总裁杜兰表示。

相关阅读:
小红书“笔记造假”质疑再起 公司称已在治理 进口游戏版号开闸 游戏业吹响回暖号角