□研究检察机关在法律监督业务中的智能化发展,应当立足于人类行为质变的逻辑基础和人类文明发展的大局进程。
□检察监督智能化的目标是解决法律监督的业务问题,方法是基于算法模型实现行为与规范之匹配性的实时计算,基础是行为数据的采集与共享。
随着大数据、人工智能技术的发展,人类快速迈进了智能时代。受到数据技术与智能技术的影响,国家的社会治理也必将迎来智能化时代。在智能社会治理的背景下,研究检察机关法律监督业务的智能化,正当其时。
检察监督智能化的理论与现实基础
从物质时代到信息时代的跃迁,是人类文明史上前所未有的事件。这个事件所带来的底层变化是人类行为模式的质变。研究检察机关在法律监督业务中的智能化发展,应当立足于人类行为质变的逻辑基础和人类文明发展的大局进程。
(一)从一次工具到二次工具的行为跃变。在网络行为模式下,人首先要借助机器进行某个具体行为的表达,这是第一次工具利用;机器则要借助机器语言最终完成行为的完整表达,这是第二次工具利用。从工具“一次利用”到“二次利用”的行为升级,是人类文明史上前所未见的行为质变。这种质变不仅表现为主体呈现方式的异化,也表现为行为方式的多样化以及行为时空特性的剧变。更重要的是,它还带来了行为表达的可数据化。数据科学因此诞生,给一切问题的解决带来全新视角。
人类是沿着信息化、网络化、数据化、智能化的路径发展。信息化、网络化和数据化共同奠定了智能化的基础,而智能化又是基于数据化以及对大数据的处理而运行。因此,智能社会治理框架下的检察监督必须通过大数据赋能而进一步发展。
(二)从弱人工智能监督到强人工智能监督的发展进程。社会科学领域向智能化方向发展的进程与自然科学领域的技术发展一样,都要经历从弱人工智能到强人工智能的发展进程。作为社会科学智能化领域的一个方向,检察监督的智能化建设同样要符合这个规律。
随着人工智能技术的发展,深度神经网络极大地提高了特征提取与分类器的工作效率。人工智能识别技术发展到今天,已经全面运用于各个领域,如人脸识别、视频监控、识文断字、听声辨曲等。这一切的逻辑基础都是基于特征提取的分类方法。特征信息是此事物区别于彼事物的认知“锚”点。因而,智能社会治理在方法论上的最大挑战是如何提炼出各类型事件的行为特征。只要能通过归纳或演绎的方法得出各种类型行为模式下的行为特征或规律,就可以达到智能治理的功效。
(三)检察监督的现实需求。检察监督的行为对象不同,意味着检察监督实现智能化所要依赖的数据来源不尽相同。因此,检察监督的数据对象不应限定在“面上”业务数据的对接,而应深入到司法机关、行政机关乃至具体人员的具体行权行为数据的对接。
检察机关开展公益诉讼检察工作也必然依赖于外部数据尤其是行业数据的收集与分析。如,检察机关开展针对大气污染、水污染的公益诉讼监督,就要对相关行业数据包括卫星遥感数据等进行收集与分析。各行业的运营者、消费者和监管者在实践中具有最丰富的数据信息,这些主体及其行为的数据分布成为检察公益诉讼监督的数据来源。
从某种意义上讲,数据收集分析的维度与颗粒度已经涉及大数据建模的方法问题,而方法选用往往与主体的职能定位密切相关。虽然互联网时代的公共性与私有性之边界相对模糊、很难通过事先归纳而予确定,但是,这并不妨碍在法律监督实践中根据正当性与比例原则的精神进行裁量与确认。
检察监督智能化发展应当以智能化发现、识别反常的社会性行为为终极目标,即完成从数据化到智能化的真正飞跃。在此所讨论的检察监督智能化,不只是停留在对各种监督对象的行为进行数据记录,还要致力于实时发现甚至事前预测潜在的违法违规乃至犯罪行为。
检察监督智能化的实现路径
数据化是智能化的根基,检察监督的数据基础决定了智能化的发展程度。其中,检察监督智能化的顶层设计决定了智能化能否达到预期效果,以及能否解决实际问题,这主要涉及业务、管理与技术的统筹协调与认知理解问题。
(一)检察监督智能化的数据基础。检察监督智能化的数据基础是否扎实,取决于监督对象行为的数据化是否充分。业务办公系统或办公平台如果能够充分收集检察监督对象行为的数据记录,那么,智能监督的问题就可被归结为算法模型的设计问题,即大数据建模问题。当然,根据数据的充分性,大数据建模可以采取统计建模或行为建模的不同方法。
除了对监督对象行为进行全流程、全链条的数据留痕以外,建议将智能监督所涉及的行为数据按照时、空、人、事、物进行五个维度的科学管理。至于行为的意志因素与量化因素,可以留由事后追究责任或定罪量刑时加以考察与确认。
从对象行为的智能监督角度,尤其是为了大数据建模及算法模型计算的便利,应当提前对相关要素做好管理。这不仅有利于数据来源相关的业务信息系统的设计与维护,也有利于模型的重复利用与升级改造。
(二)检察监督智能化的顶层设计。检察监督的智能化,从方法论上讲是行为与规范的精细化并使之可计算的过程。具体而言,它一般包括以下过程:业务行为数据化—业务行为模式分解—业务行为规则提炼—违规行为特征分析—违规行为模型构建—行为模型算法化—行为与规则之匹配性的实时计算—违规行为的实时发现与处置。这一过程又涉及行为目标设定、行为规范理解、行为特征提取、行为建模设计、算法编程实施、应用开发对接、行为监督处置等。其中,建模方法是重中之重。从目前智能治理的实践探索来看,成功案例大多得益于业务、管理与技术的高度融合。
从检察监督智能化的建设分工来看,智能治理必然需要依靠法律业务专家与技术管理专家的通力协作。法律业务专家应当致力于行为与规范的精细化并形成算法模型,即将法律性与准法律性的行为规则予以精细化与算法化。技术管理专家则应当按照法律业务专家的要求实现行为数据的可记录与数据行为的可计算。
检察监督智能化的技术关键
检察监督智能化的目标是解决法律监督的业务问题,方法是基于算法模型实现行为与规范之匹配性的实时计算,基础是行为数据的采集与共享。这三个方面既是整体智能治理体系的技术关键,也是当下检察监督智能化工程的集中疑难所在。
(一)检察监督的业务行为调研。检察监督智能化发展至少可以从以下几方面展开:第一,在网络犯罪、涉众犯罪的刑事检察业务中,提高大数据证据的运用技能。认识和理解大数据证明的方法原理,掌握从大数据的相关关系中辨识因果关系的方法技巧。第二,运用大数据建模实现民事检察和行政检察监督的智能化。如,根据行政诉讼的立案、延期、久拖不决等特征智能识别行政检察监督案件线索。第三,借助大数据建模实现公益诉讼监督的智能化。如,运用趋势建模法、聚类建模法等实现对环境污染、公民个人信息数据资源保护、网购食品药品安全等涉及公共利益的违法犯罪行为的智能化捕捉和监测。第四,运用大数据的行为建模方法实现刑事执行监督的智能化。利用大数据的算法模型实现对被监管人异常行为的监测,如摔倒、剧烈运动、攀高等监测。第五,利用大数据分析为司法解释的制定提供决策引导。如,通过趋势的统计建模发现类案的发展趋势。
以上并不是检察监督智能化发展的完整图景,检察机关应不断细化业务类型与行为类型,实现全方面、更小颗粒的行为监督。智能治理方法的本质是模型治理,而非模式治理。模型治理是在行为模式下采取更小的行为颗粒度进行监督与规制。
智能治理是技术行为的升维和法律规范的降维,是技术与法律在行为层面的统一。行为模型则是行为与规范的交叉产物,其兼具模式与规范的双重功能。基于行为模型的治理,不仅可以做到更为精细的行为治理,还可以实现更为前置的行为治理;不仅可以实现更为弹性的行为治理,而且具有更高的行动效率。
(二)大数据建模的方法理论突破。如前所述,不同的业务场景和业务目的,需要采取不同的技术建模方法。因而,能否突破之前的建模方法并形成大数据建模的方法理论体系,是实现监督智能化的最后一道关卡。
大数据建模的方法本质就是要在庞大冗杂的大数据中挖掘出价值集中的有用信息。在输入大数据后,系统根据大数据模型的算法处理,输出具有某种集中价值的分析结论。大数据的分析结论一般是一个具有增值价值的小结论。而大数据运用能否输出有用结论则取决于计算模型的有效构建,简称“大数据建模”。
目前,实践中大数据建模主要有两大类型,即统计建模与行为建模。统计建模是大数据行业普遍采用的、以统计方法为基础的建模方法,它们倾向于自然科学的建模方法。行为建模是基于行为特征信息的大数据建模方法,主要运用于犯罪侦查、司法证明领域,主要有犯罪学行为建模方法和侦查学行为建模方法,它们倾向于社会科学的建模方法。作为中立的技术方法,统计建模与行为建模本身并无泾渭之分,但这两类建模方法有各自的技术功能和概率特性。一般来说,统计建模倾向于“发现问题所在”,而行为建模倾向于“判断因果关系”。
鉴于个案的特殊性,行为特征信息的提取往往与个案行为方式及其所涉及的网络信息系统直接相关。因而,大数据的行为建模是一种具有个案针对性的具体技术方法。大量的个案组成了类案或类型行为,所以,行为建模在类案或类型行为的调查或监督中也具有很强的推广效益。通常,我们可以根据个案调查而发现的违法违规行为特征来构建类案或类型行为的算法模型,以此形成基于实时计算的智能监管体系。
统计建模的相关关系与行为建模的因果关系二者其实是从宏观到微观、从抽象到具体、从整体到部分的过程。从大数据助力监督的角度看,统计建模通常在发现潜在问题行为上具有不容忽视的价值,而行为建模则在行为的因果关系判断上具有无可替代的作用。检察监督智能化建设通常需要同时运用统计建模与行为建模。
(三)行为基础数据的采集与共享。目前包括检察智能监督在内的智能社会治理在实践层面很难推动的主要原因之一是数据的采集与共享问题。其根源,一方面是人们认为大数据运用必然涉及隐私权等相关权利;另一方面是缺乏技术创新的能动性。
大数据运用并非必然侵犯隐私权,这取决于数据行为与行为数据的法律属性。如果某些行为本身属于监督(管)者的权力范围,那么该类行为所产生的数据记录则亦属于监督者有权收集分析的范围,即监督范围。
检察监督智能化应摒弃“先达成数据共享共识”或者“先达成数据标准统一”的幻想。技术带来的问题应当首先寻求技术方法来解决,而非诉诸管理或规范,虽然就长远而言,应尽可能使之如此。从河北雄安新区的智能监督探索经验来看,边缘计算或加密计算可以解决很大一部分数据共享问题,其逻辑是:不需要拿到用户数据,但需要算法模型的计算结果,并通过边缘计算的技术方法反馈回来;如果担心数据泄露风险,则可以通过加密传输和加密计算来解决。通过这种技术方案的设计,既不违背数据权利的归属,又能达到智能治理的共治。而既有各种业务应用系统平台的数据采集不足问题,则一般可以通过插件改造来解决。在技术自由的时代,办法总比困难多。这正是信息时代的魅力所在,也是法律监督智能化发展所必须面对的创新挑战。
(作者为中国人民大学刑事法律科学研究中心副研究员。文章详见《人民检察》2022年第11期)