解决方案

当前位置:首页 > 解决方案 > 智慧检务 > 正文

人工智能赋能提升证据审查自动化

时间:2025-02-14 09:59:15   来源:大连市人民检察院检察 大连理工大学

[内容导读]    一、案例简介  本案例关注于人工智能在司法领域的运用,是一个基于大语言模型的自动证据审查系统。2023年,最高人民检察院制定了数字...

  一、案例简介

  本案例关注于人工智能在司法领域的运用,是一个基于大语言模型的自动证据审查系统。2023年,最高人民检察院制定了数字检察规划,构建了“业务主导、数据整合、技术支撑、重在应用”的工作机制。2024年,在第十四届全国人民代表大会第二次会议上,最高人民检察院回顾了2023年的工作,再次把数字检察作为赋能法律监督的重要手段。在各类证据爆炸性增长的当下,证据审查是检察机关的主要监督手段之一,也是落实数字检察战略的关键。案件中的各类复杂证据与案情密切相关,且范围往往涉及广、不同证据之间互相印证,同时还存在证据矛盾的可能。因此,必须全面激发数据活力,深入促进大数据、人工智能等科技创新成果与检察工作深度融合,以数智化赋能证据审查提质增效。

  传统的证据审查往往依赖于审查人员的经验,由专业人才进行。然而,这样的审查方式无法很好地适应司法业务对数字化和智能化日益增长的需求。一方面,专业人才的数量是有限的,证据审查不仅需要消耗大量的人力,而且在缺乏人才的情况下难以进行。另一方面,在依赖于主观经验的情况下,证据审查缺乏明确的标准与准则,无法满足司法工作中客观性的要求。因此,在促进司法智能化的过程中,证据审查自动化是亟须加强的重要措施。除此之外,在证据审查中,证据的真实性和可靠性往往是难以确认的,不同证据之间可能会存在矛盾与冲突,当事人也可能伪造或篡改证据,这一过程在过去由人工完成,为证据审查带来了很大的困扰。

  为了解决这些难题, 本案例利用了人工智能的辅助性工具,通过关键要素抽取、文本相似度匹配、文本内容分析等技术构建自动化的处理流程,如图1所示。案例把司法工作人员从繁杂的机械性的劳动中解放出来,有效提高司法效率,缓解案多人少的问题。人工智能模型建立在数学模型之上,关注于证据本身的语义与证据之间的联系。这一学习过程本身即是建立证据审查规则的过程,在保证了客观性与公平性的同时,提高了司法的公信力。整体而言,系统构建了以证据为核心的案件办理全流程证据链,这使得系统可以成为一个智能的法律助手,为案件办理提供有力支撑。通过信息抽取技术,系统可以从海量的文书数据中抽取出关键的证据信息。根据抽取出的信息,系统建立了要素查找模型,能够根据案件的需求对证据进行精准的定位。除此之外,利用大模型优秀的自然语言理解能力,系统还可以按照办案人员的自然语言要求回答相关问题,为办案人员提供全面、准确的法律法规支持和案例参考。为了使获取到的证据链更加准确可靠,案例系统对来自多部门的数据进行了整合,打破了传统司法部门之间的数据壁垒。过往的法律监督模型以传统的数据碰撞模型为主,集中于数据治理的层面,依赖于对关键字的分析,往往缺乏对文书内容的深度理解。在复杂的业务场景下,碰撞模型也无法满足实际需求,对数据的质量要求较高,对于不同类型的数据的整合能力与分析能力较差。与之相比,基于大语言模型的案例系统很好地弥补了这些不足。通过不断积累和分析实际案例数据,系统能够不断完善自身的审查能力和准确性,为司法工作提供更加高效、可靠的支持。

       

  图1:证据审查的自动化

  二、案例举措

  案例通过文本分析和数据挖掘技术,快速识别和归类大量的法律文件,提供有关案例和证据的摘要和分析。该过程涉及到对多种格式的数据进行处理,并使用要素抽取、文书生成等技术,为下游的各个运用场景提供支持,整体流程如图2所示。

       

  图2:自动化证据审查流程

  法律文书的关键要素抽取是案例系统的重要基础,司法文书中包含着丰富的证据信息,通过对该信息进行抽取,可以快速、便捷地辅助办案人员了解案情,提高办案效率。比如,从一份危险驾驶罪相关的起诉意见书中,模型可以提取出嫌疑人是XX、案发时间在20XX年X月X日、案发地点在XX市、酒精含量为XXmg/100mL。模型可以分析出不同类型的要素的共同特征,并依照设定好的标签,判断该要素属于哪种类别,从而帮助办案人员快速把握文书的要点,高效地处理和利用文书。整体而言,数据可以划分为结构化数据与非结构化数据两种。在案件的审查中,结构化数据可以说是一座富矿,其利用较为便捷,在大数据模型的构建中被广泛利用,是建立智能司法体系的坚实基础。然而,目前对结构化数据的利用大多基于数据碰撞分析与关键词检索,对文书材料的挖掘深度有限,模型的建模标准不统一,并不能完全支撑证据审查业务的要求。对此,案例使用了机器学习技术,深入提取文书中包含的证据信息,为证据链的构建提供精准、高效的支持。相对于结构化数据,鉴定报告、受案登记表等文书材料中往往包含表格、图片等半结构化或非结构化的数据。这些数据难以用固定的结构化方法来查询,往往需要使用特定工具和技术进行处理和分析。虽然利用不便,但该类文件中富含案件要素信息,可以说是沉睡的数据宝藏。对此,可以基于图文识别等技术手段,将非结构化的数据转变为结构化的数据,并统一地对数据进行清洗,挖掘出文件中蕴含的巨大数据价值。在案件的办理过程中,往往存在着大量需要分析的文书与数据。通过利用自动化的提取流程,可以把司法工作人员从繁杂的机械性的劳动中解放出来,把精力集中于案件的重难点上,有效提高司法效率。

  抽取出关键要素后,大模型能够利用其出色的语义分析能力,通过相似度对比、语义匹配等手段,将证据串联在一起,形成一个连贯的证据体系并建立要素查找模型,实现根据案件的需求对证据进行精准的定位。人为地对海量证据进行分析往往需要消耗大量的时间,且很可能无法在第一时间发现证据间的矛盾或者找到需要的证据。相比之下,大模型可以快速地根据案件需求定位到证据链上的某一环节,大幅度节约在检索证据上花费的时间。比如,办案人员可以利用危险驾驶罪的罪名来进行数据碰撞,找到罪名相关的法条与司法解释,对办案进行辅助。再比如,使用涉案人员被判的刑期进行碰撞,可以筛选出嫌疑人被判刑期的依据。根据碰撞得到的笔录或档案,能够找到被告人是否累犯、是否认罪的线索,从而对嫌疑人的判决进行调查核实,既提高了效率,又保证了司法的公平。类似的样例还有很多,办案人员只需要根据实际的需要,简单地进行数据碰撞,就能找到要查找的关键要素,大幅度节约了检索所花费的时间,简化了办案的流程。在提高办案效率的同时,大模型的中立性、明确性和经验性在一定程度上能够弥补甚至替代主观性较强、相对不确定性的经验法则,有效保证办案的质量。

  通过在汇集了大量法律资源的语料库进行训练的基础上,案例能够充分理解自然语言并进行高质量的生成。基于对自然语言形式的询问的分析,通过将抽取出的关键要素进行深度组合,案例系统可以按照办案人员的要求回答相关问题,为办案人员提供全面、准确的法律法规支持和案例参考。比如,当办案人员询问嫌疑人有没有前科,系统会综合从笔录、档案、起诉意见书等文书材料中抽取出的证据,回复出嫌疑人XX在XX年被判XX罪的答案。在案件办理中,办案人员会需要依据相关法律法规对线索进行核查和证实,传统的法律监督模型并不具有流畅对话的能力,在这种情况下,根据用户需求获取对应信息的流程往往比较复杂、准确度比较低且缺乏灵活性。与之相比,大模型具有极其出色的自然语言处理能力,这使得大模型能够精准了解用户的需求,并为用户生成直接易懂的回复。基于大模型的研判辅助系统可以帮助工作人员快速找到法律依据,确保核实工作的合法性和合规性。办案人员仅需要简单的自然语言对话,就能获取到需要的信息。这使得智能化辅助司法成为现实。此外,系统也可以把类似案例和疑难杂症案例推送给办案人员,帮助办案人员更好地了解问题本质和规律,为做出准确判断提供参考。

  为了构建证据链,仅提取出关键要素是不够的,证据链中的证据之间必须相互印证、互相吻合、排除矛盾。因此,案例系统在抽取出的关键要素的基础上,进一步地实现了证据分析比对功能,保证了证据链的可靠性。比如,对于嫌疑人XX判决九个月的结果,系统会根据XX的罪名,对相关法条法规进行查询。找到结果后,系统发现XX的罪名应判一个月至六个月,因此,系统认为刑期是有误的。类似的比对可以帮助法官准确、高效地运用证据,把司法证明的认知过程构筑于科学证据的数学语言的表达之上,保证司法的公正性。

  案例系统的构建基于大模型进行。大模型是指具有大规模参数的机器学习模型,以生成式人工智能为代表的大模型的飞速发展为智能化证据审查提供了新的机遇。生成式模型的强大能力使它能够深度阅读证据材料文书,对文书中关键证据信息进行自动地标注与校验,并对获取到的信息进行汇总。通过简单的人机对话,办案人员就能获取到需要的信息,大幅度简化了办案的流程。如今,法律加大模型已成为一种新的范式,基于大模型的案例系统能够应对多种复杂的法律场景,从各种不同的法律维度上,为用户提供服务。

  三、案例成果

  案例在实际使用过程中取得了优秀的效果,一方面,案例构建了以证据为中心的案件办理全流程证据链。通过人工智能技术,案例可以从当事人提交的证据材料、案件流程中产生的各类文书中梳理出必要的证据信息,并将证据串联在一起,形成一个连贯的证据体系。这一过程是事实真相充分呈现和证明的过程,也是实现公证审判的关键环节。另一方面,案例建立了准确、高效、安全的证据分析问答系统,这可以确保证据信息得到充分的应用,帮助司法机关全面、准确地了解案件情况。证据分析系统涵盖了证据的各个运用场景,公安系统可以通过该系统,查询嫌疑人的各项信息。检察院部门可以询问系统,得到被告人的笔录和报告。法院部门在决策时,可以预览整个链条,作为决策的依据。整个系统可以成为一个智能的法律助手,为案件办理提供有力支撑,不断推进司法工作高质量地开展。此外,案例系统在实施中对海量文书数据进行广泛抽取与分析、研判,既避免了遗漏关键信息,又提高了案件审查效率。这一自动化的流程把司法工作人员从繁杂的机械性劳动中解放出来,人工筛查的时间被缩短,刑事审判监督线索的发现和成案能力也大大提升,为一线检察官决策、办案、管理提供了有力的支撑。通过数据处理与分析技术,案例真正实现了数据融合和智能分析相结合,打通了不同部门之间的数据孤岛,充分发挥了大数据在检察机关执法办案过程中的辅助作用。

  在数字改革赋能成为新时代司法建设目标的当下,信息技术在办案流程中发挥着越来越重要的作用。虽然海量的司法数据中蕴含着巨大的宝藏,但对宝藏的挖掘仍然存在着困难。如何综合运用大数据思维,对现有的工作方式进行创新已经成为智慧司法的关键所在。大语言模型强大的能力与泛化性使其能够应对多种场景,且仅需少量的训练就能投入使用,不依赖于人工进行定制化合作,适合广泛进行推广。在政府层面,大模型也是数字政府战略里关键的一环。凭借其强大的数据处理、智能分析和决策支持能力,大模型为数字政府提供了前所未有的创新动力。在社会层面上,大模型在多个领域和任务上都表现出了超越人类的能力,在日常使用中发挥着越来越重要的作用。在当前大力推动数字检察的场景下,大模型也能够成为智慧司法的核心,为打造人工智能与证据审查一体化的智能体系添砖加瓦。

  责任编辑:广汉

声明:

凡文章来源标注为"智领安平行业网"的文章版权均为本站所有,如需转载请务必注明出处为"智领安平行业网",违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源,如出现侵权行为,请立即与我们联系,待核实后,我们将立即删除,并向您致歉。

活动专题

更多

2023政法展江苏巡展

品牌推荐更多>>