如何防控网络支付风险?尤其是在“双十一”零点这样的尖峰时刻,电子支付平台不仅要处理超过五十万笔/秒的洪峰般交易,更要保障安全。要迅速辨识出躲在交易背后盗用他人账号的“黑手”,可谓难上加难。
对此,中国工程院院士蒋昌俊在近日举行的“上海人工智能大讲堂”上接受澎湃新闻记者专访时表示,网络交易中骗子的骗术各种各样,而且会不断更新,不过监管者如果能够盯着正常用户的正常行为,抓住这个规律识别异常就能做到以不变应万变。”
蒋昌俊在2021年当选信息与电子工程学部院士。蒋昌俊长期致力于网络金融安全研究,是我国该领域带头人。他创建了并发系统行为理论,攻克了交易风险防控瞬时精准辨识的重大技术难题,主持建立了我国首个网络交易风险防控体系、系统及标准,并成功应用于网络经济、数字治理等多个领域。蒋昌俊现任同济大学特聘教授,同时也是中国人工智能学会监事长、中国云产业创新战略联盟副理事长。
现如今中国的互联网交易规模庞大,中国市场已然成为全球最大的数字支付市场,网络金融对国民经济发展具有重大意义,这使得网络交易的风险防控也成为国家金融安全的重要组成部分。近年来,金融欺诈、跨境洗钱、贸易逃税等有组织、有规模的地下诈骗产业已然形成。据不完全统计,2020年我国金融诈骗犯案人数约160万人,金额4687亿元,网络诈骗严重威胁网络金融安全。
在巨大的交易流量中,如何把恶意交易“既快又准”地辨识出来?
“难点一方面在于,以前的风控以身份认证为核心,很难甄别身份盗用和交易欺诈;另一方面,交易欺诈呈现高隐匿多变性增长趋势,面向特定场景(比如支付)的风控技术,难以应对网络交易跨行业组合欺诈,缺乏普适性和系统性。”蒋昌俊表示。
在上海人工智能大讲堂上,蒋昌俊从如何解决网络交易的高并发、高时效、高辨识三个特性角度,介绍了我国首个互联网交易风控体系建立的全过程。蒋昌俊表示,核心思想即“以不变应万变”。
首先是网络交易的高并发性。“我们现在看到网络交易系统有多用户并发访问、多业务并发操作、多进程并发处理等特点,可以概括为网络并发系统行为,”蒋昌俊表示。而并行计算机是基于顺序计算的经典计算机模型方法,像搭积木一样搭成并行实时的过程,难以分析网络并发的系统行为,需要构建全新的并发系统行为理论。
蒋昌俊谈到,通过对并发系统行为的一些性质,包括行为相关性,一致相关,受控相关等的分析,即可为后续并发调度和行为认证建立理论依据。
蒋昌俊为网络并发系统的行为分析奠定了理论基础,填补了经典的乔姆斯基层级体系所不能刻画系统并发行为及其能级的空白。具体而言,他提出并发语言识别器的PN机模型与并发语言产生器的矢量文法,创立网络并发系统的PN机理论,构建了刻画并发系统行为能力的层级谱系,阐明了并发系统交互协同中的行为相关性关系。
同时,互联网交易流量巨大,且瞬时突增。对此,蒋昌俊提出“以静制动”策略,即以静态业务横切分解,制导动态数据的实时并发计算。在此基础上,再对数据流业务网络进行解耦,分解成最小不可分解的子网,以提高实施并发性。另外,在优化并发系统的计算环境方面,通过建立一系列双匹配的BM算法,以及时间约束下的一些调度算法等,通过动态优化配置,进而实现“高时效”。
蒋昌俊发现了网络并发系统数据传输容量的性能界限,提出非均衡网络流量优化计算方法,采用计算任务全局导向的树型编码模式,突破了原有网络计算方法局部传递负载所导致的平衡过程长、效率低、算法收敛速度较慢等瓶颈,实现互联网大规模、非均衡、短时突发等的流量计算。
除了在高并发性、高时效性上解决网络交易的安全问题,还有从用户直接行为分析得来的网络交易行为认证。
在网络交易中,传统交易认证采用单域管控的身份识别认证方式,即通过网络安全的身份信息、银行账户的数字密码等进行认证。然而,这些信息极易被非法骗取,欺诈手段的多变、欺诈隐蔽性增强以及团伙跨域作案都使得这样的方式效用有限。
如何以不变应万变?
“以不变应万变”:从变化的行为数据中求解不变的行为纹理
对于实现“以不变应万变”,蒋昌俊的思路是:从变化的行为数据中求解获得不变的行为纹理。
这也是国际上较早提出的网络交易风险防控行为认证方法,但当时普遍采用的是诈骗后总结规则,缺乏统一设计,规则之间缺乏一致性,效率低、准确性差,无法应对层出不穷的诈骗手段。
蒋昌俊带领团队另辟蹊径,提出行为认证基础即“行为认人”。他提出,“现实生活中,每个人的行为习惯会体现在一言一行中。网络上也一样,任何一个细小行为都会留下‘痕迹’,如使用的设备、时长、频率……久而久之形成习惯。这种习惯如同指纹一样难以复制,具有比密码更复杂的特点,通过深入分析这些‘痕迹’,可以对网络交易支付用户进行瞬时精准识别。”
“行为认人”通过整合普通消费者的资金链、消费方式、消费时间、消费地点等多要素、碎片化的信息完成消费规律建模,然后与诈骗者一次性转移资金的异常分散规律进行比对分析,进而识别出诈骗行为。在当时应用到网络交易平台后,这套方法就将交易识别率从44%提高到96.91%。
目前,该成果已在全球最大的第三方支付平台支付宝获得应用,服务于全球200多个国家和地区的9亿多支付宝实名用户。“Paypal的赔付率是千分之1.9,也就是做1000块钱要赔付1.9元,而我们是百万分之5,”蒋昌俊表示。
蒋昌俊的团队也与中国工商银行、上海自贸区等单位建立了合作关系,通过融e行、自贸区企业行为风险防控技术等产品对金融系统进行安全监控管理。
到这里可以思考一个更为宏观的问题,AI如何切实落地场景起到实效?
蒋昌俊对澎湃新闻(www.thepaper.cn)表示,“人工智能的发展是一个长期的过程,深度学习确实解决了一些问题,但不能期待其能一下解决所有问题。还没有达到这个程度,如果期待过高,时间久了反而会起反作用。从我的经验来看,不如找准问题,找准对策,扎扎实实解决问题。”
AI的未来:扎根真实场景,突破基础研究短板
“目前,我国在智能交通、互联网金融、智慧医疗等领域已经取得了初步的应用成果。国内互联网企业也纷纷规划人工智能蓝图,比如百度的自动驾驶,阿里的城市大脑智能交通,腾讯的医疗读片和医疗影像资料处理,科大讯飞的语音识别;寒武纪、科大讯飞、商汤科技为代表的初创企业在技术上不断创新;海康威视占据全球智能安防企业的第一名。这些都是我国在AI产业中取得的实际成就。”蒋昌俊曾表示。
蒋昌俊同时指出,当前我国人工智能产业尚未形成有影响力的生态圈和产业链,与美国、欧洲相比,更加集中于应用落地,但在基础理论和原创算法方面发展薄弱,缺乏突破性、标志性研究成果,在共性技术平台、智能芯片等方面的发展也相对薄弱。
“从我国人工智能领域发展角度讲,我们很注重应用方面,但基础研究依然是短板,人工智能领域重大的理论和技术大都源自西方国家。基础科学研究的特点是需要大量资源、投入周期长、不确定性大和风险高等,这决定了其难以在短期内见效,但只有长期投入,保持耐心才能实现真正持久的创新与源源不断的技术发展。”蒋昌俊进一步说道。
值得注意的是,“对数据的理解非常重要,”蒋昌俊对澎湃新闻(www.thepaper.cn)提到,深度学习依赖于大量喂数据,那么要判断它合适不合适,光从模型、算法上考虑是不够的。“我认为让AI能够见效的一个很好切入点,即是对大数据有一些理论和分析方法。如果对大数据的结构特征、边界特征和条件特征等有结论,那么自然就知道数据的形态如何。在对数据有了深刻理解以后,在算法设计时就能更好适应及贴近数据,起到更好效果。目前有图谱学、函数逼近论、随机分析等,但还是缺少的。”
那么如何思考AI的未来?
蒋昌俊曾谈到,传统的AI注重从感知到认知的过程,实现从逻辑到计算的不断提升;而当前的AI,则是由弱到强的智能,是从闭环到开环、从确定到非定的系统。
他进一步作了解释,“目前的神经网络模型大都侧重对数据的计算层面。事实上,一个高级的智能机器应该具有环境感知与逻辑推理的能力。将AI的演算和计算进行融合,结合基于规则系统的推理能力和神经网络的学习能力,即可构建一个更强大的AI模型,推理能力也可以帮助减少神经网络学习新事物时所需的数据量。这样的交互和融合将是当前AI由弱到强的主要突破口。”
蒋昌俊认为,在构建类脑认知模型中,目前脉冲神经网络的神经元以电脉冲的形式对信息进行编码,更接近真实神经元对信息的编码方式,能够很好地编码时间信息。而由于脉冲训练缺乏高效的学习方法且需耗费大量算力,在性能上与深度网络等模型还存在一定差距。“未来,两类模型仍需要不断从脑科学中吸取营养并不断融合,发展性能更好、效能更高的新一代神经网络模型。”
在被问及学会、研究机构等在AI未来发展中的角色,蒋昌俊对澎湃新闻表示,无论是学会还是研究机构,本质上都在赋能企业,要做好这件事就要深入具体问题,比如只有真正理解交易过程的场景、规律、业务特点,才能解决问题。
蒋昌俊曾谈及30年科研历程的体会,“回顾30年来的科研历程,我深切感受到,基础创新是破解科技难题的法宝。当今时代,科技发展日新月异,面对科技创新的挑战,我们要更加重视基础创新,要不断回顾领域发展历史,梳理演进脉络,找准切入点,开阔思路、大胆创新、严谨求实,着力求解难题。”