lucy1668      2024年06月21日 星期五 下午 23:40

全文请参见《数字法治》2024年第3期

编者按

数字法院不仅仅是一种技术变革,更是一种理念、思维和机制的根本性改造。2023年以来,上海法院勇于先行先试,坚持数字改革赋能目标,以场景建设、数字建模为重点,大力推进数字法院建设。目前,数字法院的框架体系、技术平台、建设路径、操作规程已初步形成,在促进适法统一、破除信息壁垒、打击虚假诉讼、助力社会治理等领域发挥着越发重要的作用。

上海数字法院建设受到一线法官的广泛好评,也引发了社会各界的积极关注:数字法院建设与此前的法院信息化建设、智慧法院建设之间是什么关系?又有什么区别?在没有先例可循的情况下,上海法院如何全面推进数字法院建设?为解答上述问题,本刊特此邀请上海市高级人民法院院长贾宇撰文阐释数字法院的“上海经验”,并择优刊发上海法院相关文章,以期为全国法院数字化改革提供“上海样板”。

“数助办案”的法理基础:实体法、证据法与信息法的三维透视

文 | 王世轩

上海市静安区人民法院法官助理

内容提要:“数助办案”是数字法院建设的重要组成部分,其通过数据技术,对海量的司法大数据进行处理,生成各类数据以辅助案件的办理。“数助办案”的纵深发展需同时满足目的适当性、数据可用性、数据合规性的要求。法律适用程式化、办案流程单元化、文书材料结构化,共同构成“数助办案”的目的适当性。生成数据可构成证据为案件所用,也可提供信息供法官参考,但需要警惕品格证据的风险。司法大数据以服务人民为目的,以公正和法治为价值追求,数据的收集、处理、提供均区别于一般大数据,系特殊的公共利益相关数据。故数字法院建设应重视对数据安全的保障。

关键词:数助办案 数字 数据 证据 信息

一、问题的提出

利用司法大数据辅助案件审判,即“数助办案”,正是司法大数据重要的应用实践,更是未来数字法院发展的重点。人民法院信息化建设使得司法实践中产生了海量的数据,“法官与当事人在平台上每点击一次鼠标就留下一串数据”。这些涉及身份、行为、关系、财产等与审判相关的各方面数据,不断积累成为司法大数据。中国司法大数据应用建设主要聚焦于平台建设、数据汇聚整理、大数据应用推广三个方面,取得了令人瞩目的成就:基于大数据智能服务的审判支持系统和数据共享交换系统、司法审判信息资源库、各级法院大数据信息系统均得到了广泛应用。司法大数据建设更是智慧法院建设的重要阶段。

现阶段,各级法院对“数助办案”均进行了有益的探索应用。在上海法院建设数字法院的实践中,依托小样本训练抽取引擎和语义分析等技术手段,对全市法院近5年的300多万份裁判文书及诉状进行解析,唤醒海量“沉睡”数据,最终形成约7.8亿个结构数据点,并将这些数据和外部共享数据统一汇集至大数据平台。在司法大数据深度收集、处理、流动的背景下,相关法律问题也逐渐“浮出水面”,需要进一步的分析与论证,为数字法院建设提供坚实的理论基础。

(一)“数助办案”的现状解析

在数字法院的建设过程中,“数助办案”的三种模式,即纠错式、辅助式和信息式,分别对应着不同层次的功能需求,共同构成了“数助办案”的组成部分。

1. 纠错式“数助办案”

纠错式“数助办案”基于大量的司法判决文书和相关法律法规数据库,运用机器预设的模型算法对判决书进行拆解,针对某一具体问题进行提示,如案件事实认定遗漏、文书表述错误、遗漏程序步骤等。主要体现为数据的案中碰撞,即对一个具体案件范围内的信息进行碰撞与比对,生成某种结果。例如,在一个具体案件的办理过程中,各个阶段往往会在不同的操作平台上进行,而操作平台本身存在数据壁垒,导致法官难以及时发现并依法采取相应的措施。如在强制执行过程中,若执行到位,则应解除对当事人财产的查封、扣押、冻结等限制措施。而实践中不同财产的控制依赖不同平台,与执行办案系统相互独立,即使法官在执行办案系统中进行结案操作,相关财产控制措施也可能并未及时解除。此时,若通过案中的数据碰撞,及时将财产控制系统中的信息同步至办案系统,给法官相应提示,就可避免出现执行完毕但未能解除相关限制措施的情况,即实现了纠错的目的。

2. 辅助式“数助办案”

辅助式“数据办案”聚焦于利用数据科学及人工智能、机器学习等相关技术,协助法官办理案件。此类方式大量应用于刑事案件。例如,美国法院系统推行compas、psa、lsi-r等风险判断程序,用以帮助法官确定受害人是否需要进行审前羁押以及保释等情形,通过将客观标准和主观标准融入算法当中,以提供风险评分。上海市高级人民法院开发的刑事案件智能辅助办案系统(简称“206系统”),正是通过运用相关数字技术,制定统一的证据标准、证据规则并嵌入刑事办案系统,从而大大提升了司法效率,减轻了司法人员的工作负担。

3. 信息式“数助办案”

信息式“数助办案”依赖于数据的案际流动与跨部门流动,为法官审判提供相应的信息,体现为数据的案际流动、院际流动、跨部门流动。

案际流动指不同案件中的数据进行碰撞,生成某种结果的数据处理方式。关联案件的相关信息可能会对审判的走向产生影响。例如,在离婚诉讼中,系统对案件当事人的其他案件进行检索,重点识别案件当事人可能存在的经济纠纷,向法官推送相关信息,以帮助法官甄别恶意逃债的行为。数据的案际流动可能同时涉及院际流动。

院际流动指数据在不同法院间的流动,包括同级法院间的数据流动与上下级法院间的数据流动。基于诉讼管辖的规定,同一纠纷可能在不同法院起诉,同时涉及多个审判或执行程序。基于大量数据的碰撞与运算,可以就当事人行为、类案信息等形成更加深度的分析,呈现类似“当事人画像”的运算结果。

跨部门流动主要指法院外数据向法院内流动,前者如自然人死亡、企业注销等信息,由相关管理部门掌握,审判中往往由当事人向法院提供相关证明材料。若当事人隐瞒或遗漏相关信息,则很有可能导致案件出现差错。若相关信息可以由管理部门向法院同步传送,由法官实时掌握,则会避免上述情况的出现。

(二)“数助办案”的未来方向

“数助办案”将围绕先进技术的创新应用、稳健技术的广泛应用展开,并最终实现“数”与“案”的深度融合。一方面,大数据技术蓬勃发展,以自然语言处理(nlp)、深度学习与模型训练等为代表的各项先进技术已经得到大量的应用,也取得了实际的成果。先进技术具备创新性、革命性、前瞻性的特点,可以从更深的层面推进审判的数字化与信息化。司法实践应当对先进技术抱有开放性的态度。另一方面,区块链、云计算、数据采集与处理等技术,已经通过广泛的适用而日趋成熟。对于此类稳健技术,应当努力做到全案由覆盖、全流程覆盖,实现办案全过程的数字化与信息化。

“数助办案”的最终目标并非办案的数字化,而在于“数”与“案”的深度融合。“驱动司法制度的全方位变革,并最终实现司法领域从数字赋能到制度重塑的革命性变革”。数字技术不仅帮助了案件审判,更影响了案件审判,改变了传统的诉讼模式。数字化的数据、电子证据、网络行为痕迹等都可能成为诉讼案件的关键证据,为司法审判提供事实依据。同时,通过数据分析和挖掘技术,可以更准确、高效地处理和运用这些数据,有助于提升诉讼效率,确保司法公正。这不仅要求在数字法院建设的过程中重视对数字技术的引入及应用,还要求在构建相关制度时充分考虑数字技术对办案模式的影响。换言之,数字化或者说“数字”早已不仅是提升办案质效的工具,更是成了当代诉讼活动不可或缺的基础与环境。

(三)“数助办案”的基础问题

“数助办案”的发展不应是盲目的,要有实际可达的愿景以及可行的实施方案,故应解决“数助办案”的基础问题,明确其基本原理,构筑好进一步探索和推动“数助办案”的理论基石。

“数助办案”的本质在于通过大数据分析技术,实现帮助法官办案的目的。而大数据分析的基本原理是,基于过去的数据建立函数模型,在接收新的信息和输入后,会得到对应的输出,这个输出值是对业务场景中的缺失信息进行填补,即“原始数据—加工—生成数据”的模式(参见图1)。

图1:“数助办案”的全景透视

换言之,“数助办案”中的“数”包含两类数据,即原始数据与生成数据。因此,“数助办案”的实现,需要明确回答以下几个问题。首先,应充分探讨“数助办案”的目标适当性问题。不仅要明确何为“办案”,更要充分阐明“办案”运用大数据技术的客观条件,否则,“数助办案”将成为无本之木、无源之水。其次,应当充分研究生成数据为何能为办案所用,即大数据信息的可采性、可靠性、证明力问题,使得生成数据可以依法转换为案件所需的信息。最后,原始数据与生成数据均应当符合现有法律法规,不仅应在个人信息保护、隐私保护的框架下运行,也要符合数据跨部门流动的规范,并采用合理的处理及呈现方式。因此,目标适当性、数据可用性、数据合规性共同构成了“数助办案”的基础问题。

二、“数助办案”的目的适当性

“数助办案”的成功建设,以对审判办案本身的“可解构”为前提。法律适用系办案的核心,亦是诉辩争议的焦点,庭审即围绕着法律适用展开。而立案、送达、证据交换、宣判等程序均以庭审为核心展开,有严格的程序性规范。从立案到结案的过程中,当事人的诉讼行为及法院的职务行为均表现为案卷中的材料,对争议的最终裁决以法律文书的形式得到落实。因此,以法律适用为原点,对案件进行逐项拆解,是将“数字”充分融入审判的基础和前提,更是“办案”的范围和界限。

(一)法律适用程式化

法治至少具有两方面的特点:首先必须由立法机关来制定法律,其次制定的法律也必须得到实施,而成功实施成文法律的一个关键要素正是它的统一适用。成文法国家以“涵摄”作为法律适用的路径,其关键在于法律规范的结构。依不同的标准,可以将法律条文划分为严格规定与衡平规定、任意规定与强行规定、命令行为之规定与授权规定、完全法条与不完全法条等。完全法条,又称完整法条或封闭性法条,是指法律条文中明确规定了构成要件及其对应法律效果的法条。这类法条的特点在于,一旦案件的事实符合法条所设定的构成要件,即可直接依据该法条判定当事人的权利义务关系或法律责任,无须再结合其他法条就可以得出明确的法律结论。即“以一般方式描述的案件事实(构成要件)被赋予同样以一般方式描绘的法效果。赋予意指:当构成要件所描述的案件事实存在,法效果即应发生,易言之,即应适用于该具体事件”。上述结构可以抽象为“如果—那么”结构,即“如果存在x(构成要件),那么y(法律后果)应当发生”或者“如果存在x(构成要件),那么应当存在y(法律后果)”。因此,在“数助办案”的实现过程中,可以通过对“x”与“y”的提取,实现对法律规范的拆解和数字化。

围绕法律规范的结构及涵摄的思路,随着法学研究的进展和司法实务的深入,关于法律适用的具体方法也逐步发展。目前,主流法律思维方法主要包括法律关系思维方法、个案类比思维方法、请求权基础思维方法、要件分析方法、关联分析法、归入法等。其中,个案类比思维与请求权基础思维存在本质的区别,前者作为英美法系的裁判规则,本质在于类推;后者以司法三段论为基底,本质仍然在于涵摄。因此,个案类比思维无法成为我国法律适用的主要方法。

法律关系思维方法是我国司法实务传统的法律适用方法,得到了广泛的应用。其以案件事实发展的时间线索引导检视思路,因而又称历史方法,基本思路为就案件事实发生的过程,依序检讨其法律关系。随着大陆法系学说的不断引入,请求权基础思维方法的影响逐渐扩大。民事纠纷中,以原告请求被告为某种给付为典型,据以支持原告请求权的规范基础或法律行为,称请求权基础(anspruchsgrundlage),请求权基础思维即以此展开。实务中的要件分析方法,也叫基础规范分析方法,是指以构成诉讼基础的基础规范作为出发点,通过分析并涵摄规范要件对案件作出裁判的方法。其实质是请求权方法,以权利基础作为诉讼的出发点,以实体法律规范构成要件分析为基本手段,经过数个步骤作出裁判。

关联分析法(relationstechnik)作为请求权基础思维方法的“实战版本”,同样进入学术和实务的视野中。关联分析法又称关系分析法、关联求证法,其主张非同时处理原告与被告讲述的“两个故事”,而是划分不同阶段依次审理,原则是程序先于实体、法律先于事实、原告先于被告,由程序阶段、原告阶段、被告阶段、证据阶段、裁判阶段组成。关联分析方法主要适用于民事案件,这一方法的核心理念是只有存在争议并且相关的事实才需要被证明。在我国诉讼法律体系中,“实质真实原则”扮演着重要的角色,法庭对于当事人双方无争议的案件事实也可以进行查证。

归入法(subsumption technique)适用的范围更加广泛,是一种可选的法律适用的统一方法,在德国,每一份司法或行政决定都依据此种方法作出。这种方法严格地规定了得出法律结论之前必须遵守的步骤,这些步骤使得法律适用者能够用一种系统的方法来审查案件事实,包含总起、定义、归入、结论四个步骤。同时,要求法律是每一次归入的起点和终点。

上述法律适用方法之间存在区别,但是存在明显的共同点:首先,均围绕着涵摄展开,强调对构成要件的理解和适用;其次,均将法律适用过程依一定的标准明确为具体的数个步骤展开;最后,实践中可能同时交叉不同分析方法用于明确法律适用。因此,无论采用何种法律适用的具体方法,均可以将其具体步骤拆分明确,提炼为“s1、s2、s3……”匹配相应的案件数据,并使用相关的数字技术完成其推理过程,最终得出结论“t”,实现数字技术对法律适用的赋能。

(二)办案流程单元化

办案流程可以细分为数个“单元程序”。如在我国诉讼法体系中,案件流程分为诉讼程序、非诉程序、执行程序。以民事诉讼法为例,其诉讼程序包括普通程序、简易程序、调解程序、公益诉讼程序、家事诉讼程序等。其中,普通程序又可分为起诉与受理、开庭审理前的准备、开庭审理、延期审理、撤诉、缺席判决、反诉、诉讼中止、诉讼终结等。针对其中的“开庭审理”程序,又可细分为开庭准备、法庭调查、法庭辩论、案件评议和宣告判决等。其中的法庭调查,又可细分为当事人陈述、证人作证、出示相关证据、宣读鉴定意见、宣读勘验笔录等步骤。

数字技术赋能办案流程,亦需要以办案流程中的每个单元程序作为锚点,实现数字化与数据化。各地法院对此均作出了有益的探索。例如,上海市高级人民法院于2021年3月制定《关于完善全流程网上办案体系促进审判高质量发展的指导意见》,启动并全面推进全流程网上办案体系建设工作,网上立案、在线庭审、庭审记录改革、电子送达、智慧执行等工作上线运行,实现全流程的无纸化与平台互融互通,审判数据实时共享。上述全流程网上办案的思路亦是深化“数助办案”的思路:第一,继续梳理完善所有的单元环节,确保每一个单元程序均可以数字化与数据化,运用区块链及相关技术确保数据的稳定性及不可篡改性;第二,打破各个单元程序的数据壁垒,推动数据的案中碰撞与案际流动,尤其是对于一个特定案件及其关联范围内的信息进行充分碰撞与对比,利用数据实现充分纠错与辅助。

(三)文书材料结构化

文书材料可分为当事人提供的文书材料、法院依法制作的文书材料两类。司法实践中,两类文书材料均形成了一定的格式。并且,文书样式的本质不仅仅是文书写作格式规范,更重要的是对诉讼案件程序的规制,进而对诉讼的审理思路发挥指引,同时可以对审判中的诉讼行为、诉讼程序、案件管理、法律解释、法律适用等发挥规范性指引的作用。最高人民法院先后发布大量文书样式规范,如《民事申请再审案件诉讼文书样式》《行政诉讼文书样式(试行)》《人民法院民事裁判文书制作规范》等。上述文书样式均对法律文书提出了结构性的要求。裁判文书作为总结法官审判过程的重要载体,详细记录了案件的审判过程,其中也蕴含了法院在案件审理过程中的逻辑脉络,因此可以有效地利用逻辑结构对文书内容进行过滤,从而筛选出文书中的重要信息。基于此,文书解构成为司法大数据来源的重点。通过文书结构,可以对文书内容进行深度的处理,如通过自然语言处理(nlp)技术对民事裁判文书中论辩元素进行识别的过程,正是基于“原告诉称”“被告辩称”“法院查明”“本院认为”和“判决结果”这几个内容的提取,分析裁判文书中出现的论辩信息。

综上所述,“数助办案”的范围包括数助法律适用、数助办案流程、数助文书材料三个方面,而案件中法律适用程式化、办案流程单元化、文书材料结构化,正是能够在办案中运用数字技术的前提。在“数助办案”的实践中,要素式审判是体现法律适用程式化、办案流程单元化、文书材料结构化的集大成者。一般认为,要素式审判是指对固定案情的基本事实要素进行提炼、归纳并审理争议焦点、简化裁判文书制作,从而简化审理流程、提高审判效率、实现类案专审简案快审的审判方式,具体包含庭前填写要素表、开展要素式庭审、制作要素式裁判文书三个阶段。沿着要素化的思维方式推动数字技术在办案中的应用,使其不仅用于简单案件的审理,更逐步扩展至所有案件,亦是“数助办案”的发展方向。因此,“数助办案”具备目标适当性的要求。

三、“数助办案”的数据可用性

通过大数据技术生成的数据如何为办案所用,是实现“数助办案”的关键问题。就生成数据的作用而言,可以分为三类:第一类,作为证据的生成数据,即生成数据可用于证明案件事实;第二类,用于辅助证明的生成数据,即该数据并非直接或间接证明案件事实,而是通过大数据分析的相关技术,辅助现有证据对事实的证明;第三类,非证据相关类生成数据,此类数据与案件事实不相关,但与法律适用或其他需法官决策的事项相关。

(一)作为证据的生成数据

1. 生成数据与大数据证据的区别

“数助办案”背景下作为证据的生成数据,并不完全等同于传统意义上的“大数据证据”。一般而言,所谓“大数据证据”往往同时涉及三种不同的证据,即大数据集、大数据算法、大数据报告。关于大数据的运用主要有四种形式,分别指将大数据的载体作为证据、将大数据等量复制的数据副本作为证据、将大数据中的部分数据作为证据、将大数据分析结论作为证据。实质上,“大数据证据”本身属于中间概念,仅仅是对某一类证据的概括,对于一份具体的材料能否具备证据资格、是否具备相关的证明力、是否具备可采性,须独立按照我国诉讼法明确的证据规则进行判断,而与其是否构成大数据证据无关。因此,本文不执着于对“大数据证据”这一词汇本身内涵和外延的讨论,而是聚焦于数字法院建设过程中、通过数字技术生成的、可用于案件事实认定的一切数据。

着眼于“数助办案”所使用的大数据技术在事实认定中发挥的作用,可以将用作证据的生成数据分为两类:第一类,运用大数据技术分析收集的证据,指通过数据技术挖掘出的传统证据;第二类,大数据分析结论,又称大数据报告,系通过数据技术对海量数据进行相关处理后,得出结论并在审判中使用的证据。二者的表现形式、法律属性、审查判断规则均存在较大差异。

2. 生成数据的证据能力

证据能力即证据资格,又称证据的适格性,是指某一材料能够用于证明的能力或者资格,亦即能够被允许作为证据加以调查并得以采纳的资格。对于第一类生成数据,虽然利用了大数据技术,但从证据材料的表现形式以及运用方法来看,其与传统的证据并无二致。换言之,就此类生成数据而言,大数据技术打破了数据壁垒,本质上仍然是寻找证据的工具和方式,对证据本身没有影响。因此,第一类生成数据具备相应的证据资格。

关于上述第二类证据,即大数据分析结论,由于相关法律规范的空白,此类证据的属性存在一定的争议。一般认为,大数据分析结论是大数据算法对大数据集进行分析后所形成的分析报告,是一种以派生形式出现的证据,与鉴定意见具备一定的相似性,在法律性质上构成意见证据。有观点认为,此类证据不同于现有的任何证据种类,理应作为独立的证据种类;亦有观点认为,此类证据并无区别于其他证据的决定性差异,无须新设法定证据种类。即使相关法律规范空白、定性存在争议,但大数据分析结论的证据资格已逐渐被接受,亦有法院肯定了大数据分析结果作为证据使用的可用性。本文认为,应当着眼于案件中具体的大数据分析结论,并且结合证据原理判断其是否具备证据资格。从证据原理上看,证据资格的基本内容包括证据的客观性、关联性、合法性。具备上述特征的大数据分析结论,当然具备证据资格。

3. 生成数据系法院依职权调查的证据

“数助办案”生成数据的特殊性在于,其并非来源于当事人,而是来源于数字法院对司法大数据的碰撞与分析。就诉讼法中证据收集的方式而言,一般包括当事人证据收集、法院证据收集,后者又包括根据当事人申请的证据收集、法院依职权的证据收集两类。数字法院建设中,司法大数据的运算并生成相关数据系后台自动完成,在案件特定节点主动向法官推送,数据的申请与推送无须当事人申请。故从来源上看,与法院依职权的证据收集最为接近,是数字技术便利法官调查取证权的体现。

“数助办案”的实现似乎是对法官调查取证权的扩张。关于法官调查取证权的争论,长久以来存在“限缩论”与“扩张论”两种观点:前者秉持程序正义的理念,认为法官调查取证往往会构成对某一方当事人的协助,与法官中立原则形成了冲突;后者基于实体正义的立场,认为当事人取证难和举证能力欠缺的背景下,弱化法官调查取证权会损害当事人的实体权益。

实际上,“数助办案”与法官调查取证权的范围争议无关,更不存在违反程序正义之嫌。首先,依职权调查取证并非法官的自由裁量权,而是其法定义务。对法定义务的充分履行必然是法治的应有之义。其次,信息本身并不对应职权范围。在数字时代大背景下,信息传递的速度和体量呈爆炸式增长,无论是法官还是当事人,能够获得的信息均越来越多。法官正当行使职权,应当聚焦于对此类信息可采性的判断,在恪守当事人平等原则的前提下,让判决建立在更加充分的事实基础上,而非直接拒绝接受相关生成数据。

(二)非证据类生成数据

除上述作为案件证据的生成数据外,还可用于其他方面:第一类,生成数据辅助司法证明。如上海市高级人民法院开发的“206系统”,通过大数据技术在证据推理环节高效组织数据,在证据评价环节辅助证据标准的数据化校验与证明力概率评价的科学化。第二类,生成数据辅助量刑。即通过各类大数据技术提取法律文书要素,进行类案识别和模型训练,用机器学习等人工智能方法形成量刑算法,在此基础上实现量刑预测和偏离度测算。第三类,生成数据统一法律适用。即在强人工智能成熟前,通过大数据构建错案规则,并将其结构化、代码化、平台化,形成案件质量回溯数字共同体以避免法官办理错案。

非证据类生成数据的内容本身并非直接或间接证明案件事实,而是对现有案件材料的有效分析,以辅助法官作出相应决策。因此,此类生成数据不存在证据资格与证据属性的问题,使用此类数据也无须以证据规则为标准,而是应当以防范相关技术风险为立场,避免暗箱决策、算法歧视等风险。应当破除对大数据智能产生的非理性崇拜,将此类生成数据准确定位为司法辅助的角色,强调法官的主体地位,消除技术手段的机械主义倾向,对此类生成数据进行独立的判断,避免因数据技术产生新的不公正。

(三)生成数据的“品格证据”风险及应对

品格证据排除规则的主要目的在于防止以被告人品格作为对其定罪的依据。司法实践中,刑事案件中通常会以品格与案件无关为由申请排除证据,民事诉讼中也会以缺乏关联性为基础将品格证据排除在外。传统的法院办案过程中,案件与案件之间、法院与法院之间存在着天然的数据壁垒。案件承办人无论是查阅还是调取其他案件的相关材料,不是存在障碍难以实现,就是需要花费大量的成本而难以成行。如前所述,随着全流程网上办案的建立以及数字法院建设,数据的案际流动与院际流动的壁垒逐渐被打破,只需符合相关规定,法官就可以足不出户式地调取其他案件的相关信息。甚至不需要法官主动发起,系统就会自主基于大量数据的碰撞与运算,就当事人行为、类案信息等形成更加深度的分析,形成当事人画像直接向法官推送。

系统自动向法官推送的信息,完全可能是案件办理所需以外的其他信息。此类信息并不一定能够成为案件证据,但会影响法官的心证,进而对裁判结果产生影响。例如,在民间借贷纠纷中,法官收到了系统推送的债务人其他民间借贷纠纷案件的信息,且其他案件中债务人均未能按期归还欠款。这极有可能会使法官产生该债务人“总是借钱不还”的印象,由此作出对该债务人不利的事实认定。因此,法官在收到相关推送时,应当同时警惕该信息可能带来的品格证据风险,具体而言:

第一,应当认识到,品格证据在多数情况下和特定案件事实的关联性较弱,仅在特定的情况下才能够被采纳,不能无条件予以接受。

第二,消除对数据及算法可靠性的“迷信”。生成数据的可靠性取决于原始数据的全面性、算法的公正性、运算的准确性。实践中并非所有数据均参与运算,算法本质上仍然由人设计,不可避免地包含人类的认知偏见,且运算难免存在误差。

第三,要认识到生成数据并非全面,避免以偏概全。数字法院的建设并非一蹴而就,数据壁垒也并非在一瞬间被完全打破,因此必然存在着信息的偏差。即法官能接收到的信息必然是已经完成数字化的信息,而对于审判有影响的其他尚未数字化的信息难以被法官了解。法官必须对生成数据的非全面性有充分的认识,进而避免作出不当的判断。

四、“数助办案”的数据合规性

面向法院的司法大数据,是法院在司法工作中形成的审判流程、执行信息、法律文书、庭审活动信息、司法政务、司法人事、外部协查等数据的总和及其关联关系,既包括审判执行活动中的案件基本情况等结构化信息,也包括法律文书等半结构化数据,还包括庭审录音录像等非结构化数据。如前所述,大数据分析的基本原理可以概括为“原始数据—加工—生成数据”的模式,分别涉及数据的收集、处理、提供三个阶段,均应符合我国现行法律中规制数据的相关规范。

(一)数据合规的一般逻辑

1. 数据合规的逻辑起点:个人信息保护

数据合规的逻辑起点在于个人信息的保护。个人信息本质上属于人格利益,基于该权益的性质及维护自然人主体尊严的要求,个人信息本身不能直接被收集、处理和提供。在民法理论中,为保护信息主体的信息自决和人格利益,知情同意原则一直被视为个人信息保护的“帝王条款”。《民法典》第111条明确规定非经依法取得同意(包括但不限于数据主体明确同意)不可使用他人的个人信息。但在大数据时代,数据的收集方式开始向自动化转型,数据的流通与共享拓宽了数据利用的目的,这使得严格遵守知情同意原则的难度更大、成本更高,可能会僵化数据在不同场景中灵活运用的标准。因此,《个人信息保护法》跳出了简单的“信息自决”或“告知同意”二元立法思维模式,认可了个人信息的复杂性并在此基础上确认了多样化的合法性基础。《个人信息保护法》第13条规定了知情同意原则的例外,且第34条规定国家机关为履行法定职责处理个人信息,应当依照法律、行政法规规定的权限、程序进行,不得超出履行法定职责所必需的范围和限度。

2. 数据合规的基本要求:安全原则

数据的合规处理除了需严格在《民法典》和《个人信息保护法》的框架下进行,现行的《数据安全法》和《数据安全管理办法》中,均突出强调将安全作为数据收集、处理与提供的前提,建立数据分类分级保护制度。国家根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,对数据实行分类分级保护。因此,在数据合规处理中,需关注开展数据收集、处理、提供的网络系统是否具备妥善保护数据安全的能力。可以通过核查网络系统是否完成网络安全登记保护工作,以及是否具有应急预案等方式判断网络系统的安全保障能力,在具备安全能力的基础上进行数据的收集、处理及提供。

(二)司法大数据的特殊性

司法大数据的合规要求不能简单遵从上述数据合规的一般要求。原因在于,司法大数据在数据目的、数据行为、数据价值上均存在与一般数据完全不同的特征。

1. 司法大数据的目的:服务人民

司法大数据以服务人民为根本目的。有观点将中国法院司法大数据的发展逻辑归纳为“司法大数据发展方向遵循顶层设计,司法大数据发展的初衷是服务审判管理,司法大数据建设的出发点和落脚点是服务人民”。以人民为中心是司法工作的价值导向,无论是智慧法院、全流程网上办案,抑或数字法院建设,目的均在于服务人民,充分保障当事人的诉讼权利,力图通过数字技术让人民群众在每一个司法案件中感受到公平正义。未来的司法大数据发展,也将秉持服务司法实践、服务公众需求、服务社会发展的理念,提升司法大数据的应用效能,助力审判体系和审判能力的现代化。

2. 司法大数据的价值追求:公正与法治

传统个人信息保护的利益衡量主要体现为个人信息利益与社会公共利益和企业数据利益之间的冲突与平衡。数字时代,个人信息的流通会带来巨大的经济效益,信息的广泛利用是不可逆转的时代潮流,个人信息的公共属性也越来越强。而司法大数据本身与企业数据无涉,本质上系个人信息保护与司法需要之间的利益衡量。且司法需要并非一般意义上的公共利益,其蕴含着一般公共利益所不具备的对公正和法治的追求。

3. 司法大数据的行为场域:人民法院

司法大数据区别于其他数据的关键,在于其收集、处理、提供均发生在特定场域内,具备收集的特定性、处理的内部性、提供的目的性等特征。首先,数据的收集系当事人参与司法活动时形成,即数据收集的特定性。在数字法院建设的大背景下,当事人提交的各项案件材料都以电子化的形式在系统中进行录入,当事人身份数据、财产数据、关系数据等以高度结构化、要素化的形式构成了司法大数据。其次,数据的处理依靠法院内部系统完成,即数据处理的内部性。对于收集到的司法大数据,通过数据识别、要件提取来进行分析比对,依托海量类似案件信息和司法大数据的运算,集合法官的集体智慧进行实证法研究和综合衡量。最后,经过大数据技术处理过的司法大数据,最终用于司法办案,即数据提供的目的性。此类数据不仅可辅助法律适用,还可辅助法官决策,能够让数据发声,使数据关联,用大数据思维发现审判规律、提高审判质效。

(三)“数助办案”视野下的司法大数据合规

基于司法大数据在目的、价值追求、行为场域的特殊性,司法大数据对个人信息“合理利用”的范围应不同于一般领域的个人信息的合理利用。例如,当事人的婚姻状况、财产信息固然属于司法应保护的法益,但在当事人假借离婚逃避债务的案件中,其个人信息如何处理值得探讨。同时,对司法数据的安全性保护应强于商业数据的安全性保护。原因在于,商业数据大多对个人信息进行了去标识化的脱敏处理,使其不能指向特定对象,失去了人格属性,更多地体现为财产属性。而对于司法数据而言,如果过度对个人信息进行脱敏化处理,可能会导致无法准确提取案件要素,进而无法得出精确的数据分析,使司法数据冗余,失去了利用价值。因此,司法数据往往承载着更多的个人信息,应严格限制在人民法院内部进行流通与利用,并建立科学的人员访问管理和控制制度。司法数据一旦泄露,不仅会导致个人信息权益受损,还会阻碍数字法院的建设进程。

五、结语

“数助办案”的发展需要同时满足三个前提:第一,目的适当性。即划定“办案”的范围,并且“办案”具备适用数字化技术的基础。第二,数据可用性。通过大数据技术生成的相关数据能够为案件所用,无论是作为证据抑或其他信息。第三,数据合规性。即司法大数据的运用符合现行法中关于信息与数据的相关规范。

法律适用程式化、办案流程单元化、文书材料结构化是司法实践的现状,为办案提供了运用数字化技术的可能性和思路,共同构成“数助办案”的目的适当性。生成数据包括证据类、非证据类,前者的运用须严守证据规则,构成法院依职权调查的证据;后者旨在对法官形成辅助,应正确认识数据与算法可能存在误差,对相关信息进行充分的分析与判断,同时警惕生成数据的“品格证据”风险。司法大数据不同于一般数据,其以服务人民为目的,具备收集的特定性、处理的内部性、提供的目的性等数据行为特征。因此,在司法大数据中,应重视对数据安全的保障,为数字法院建设打下坚实的基础。

来源丨数字法治、上海市静安区人民法院

编辑:丁易简

声明丨转载请注明来自“上海高院”公众号

上观号作者:浦江天平


《数字法治》刊发上海法院文章|王世轩:“数助办案”的法理基础:实体法、证据法与信息法的三维透视 本文内容来自网络,仅供学习、参考、了解,不作为投资建议。股市有风险,投资需谨慎!