大数据法律监督综合研判平台
大数据法律监督综合研判平台
品牌:江苏耐力
展品简介:
系统将围绕检察院“四大检察”为核心,打造人民检察院“法律监督大数据”中心,形成一个数据中心加多种监督模型为核心的一体化监督平台,涵盖民事监督、刑事监督、行政监督、公益诉讼、司法救助等。数据中心集合统一业务系统2.0数据+数十家外单位数据为核心,利用人工智能+AI元素提取方式,创建法律监督“元数据”中心。通过自定义监督模型,针对海量数据进行碰撞、比对、分析,批量输出问题线索,并通过线下调查核实工作的有力支撑转换为办案成果。推动检察机关法律监督与其他各类监督有机贯通、相互协调,全面深化司法体制改革,大力推进检察队伍革命化、正规化、专业化、职业化建设,着力提高法律监督能力水平。
功能介绍:
1.整体架构
系统整体架构符合国产化技术标准,系统架构还需具有完善的菜单管理、插件管理、用户日志、定时计划、接口管理、数据定时备份等功能。使用的软硬件均满足国家安可要求,本次系统的建设将满足覆盖市区(县)二级检察机关使用,软件技术架构设计适配检察机关国产化的操作系统、中间件、数据库、浏览器(360浏览器检擦院专业版)等。
2.法律监督资源中心
建立法律监督大数据平台专用数据中心。系统对现有数据进行重新整理、清洗、并建立适合法律监督模型的元素数据库。包括检察机关所有办案数据及信访数据,外部公安机关、审判机关、司法局、行政单位、团市委、市民政局困境儿童、事实孤儿信息,市妇联、市残联未成年人权益受侵害信息等业务数据。
3.工具插件
3.1人工智能
法律监督平台是集信息采集、案件智能分析于一体的综合系统,平台引入大数据分析挖掘算法、人工智能等关键技术将极大的提升平台的智能化、精确化,能更好挖掘线索。
人工智能包括很多方面,本次平台所用的关键人功能智能技术主要涉及文字处理方面,分词、词法分析、句法分析、信息抽取、文书结构化、文本纠错、文本匹配、文本摘要等,以及为此服务的文字标注、算法服务、深度学习、训练模式、文本转换等。
3.2文本标注
文本标注是对文本进行特征标记的过程,对其打上具体的语义、构成、语境、目的、情感等数据标签,通过标注好的训练数据,教会机器如何来识别文本中所隐含的意图或者情感,使机器可以更加人性化的理解语言,构建了精准高效的多语自然语言处理算法,包括分词、词性标注和命名实体识别、敏感性分析、情感分析、自动摘要、关键词抽取、文本分类、文本质量评估、热点聚类、事件要素提取、知识图谱构建等各个层面。
文本标注是对文本数据进行特征标记的过程,对其打上具体的语义、构成、语境、目的、情感等元数据标签,以创建一个巨大的文本数据集(文本训练数据)。
通过学习准确标注的文本数据,机器将能够使用自然语言进行足够有效的交流,多维度地分析文本数据,代替手工做一些较为重复和单调的任务,从而腾出时间、金钱和资源来专注于更具战略意义的工作。通过利用高质量文本数据简化事务的能力在各大行业中都具有深远影响。
3.3智能搜索
通过构建elasticsearch全文检索库,使得搜索更加轻松,支持双要素比对搜索,如选择相关字段于另外的文书、卷宗内容比对检索,方便检察官日常办案需求。
3.4 OCR图文转换工具
部署一套专业且识别率极高的“OCR文字识别”系统,在检察院内网私有化部署,利用接口进行开发,做的一个批量识别程序,能够非常准确的识别案件电子卷宗图像中的文字,通过采用优化的光学字符识别系统,可准确的对文字字体进行识别和段落切分。同时支持识别完后版面恢复功能。主要用于将所有得电子卷宗识别成文字形式,并可通过双层PDF形式展示。可支持私有化部署,独立服务器版本。
3.5 Ofd解密转换
ofd(open fixed-layout document)是由工业和信息化部软件司牵头,中国 电子技术标准化研究院成立的版式编写组制定的版式文档国家标准,以方便 的进行电子文档的存储、读取以及编辑。
3.6 API推送接口
系统可对相关处理完成数据提供高性能数据查询接口:支持低延时、高并发的查询接口,支持快速查询、即席查询,支持高性能数据库,为第三方系统对接服务提供渠道。提供数据访问的API供各部门使用,具体包括首页、标签管理、应用管理、API管理、API共享管理、API运行分析等。
4.监督模型建模
4.1特定场景建模
刑事案件法律监督模型:立案监督、刑事审判监督、公益诉讼等
民事监督:虚假诉讼、套路贷
刑事监督:刑事侦查监督、刑事审判监督、刑事执行监督
公益诉讼:非法套取公积金模型、环境污染模型、食品药品监督模型等
4.2建模练习
在模型建立过程中业务范围内使用者可以自行做一定的调整和修改,实现相关的模型配置功能。采用开放式技术架构,与后续的其他法律监督模型实现数据共用,按数据种类和性质等构建各类主题数据库、应用数据库等,成为元数据中心的组成部分,方便各业务部门在建立模型时能够轻松便捷,整体监督模型构成共用的可扩展的应用开发基层平台,在数据基础上建立相关模型形成家族式应用群。
4.3模型资料
提供全国各地检察机关“四大监督”模型资料,包括模型名称、所需数据、模型描述、模型规则等。方便检察官了解各地模型建设情况。
产品特点:
(1)数据处理能力(OCR图文识别、ofd格式解析、数据要素提取)
系统可利用“2.0”现有数据,通过对数据的深度挖掘、转换、提取,形成法律监督专用数据中心。也可针对外部数据进行导入并批量处理。
(2)监督模型自定义
系统可针对四大检察设定不同的监督模型,支持检察官自行增加新模型。
(3)统一规划节省资源
系统按照四大检察方向,统一规划架设,后期可吸纳全国各地优秀模型,也可将全市各家检察机关已建设成功法律监督模型移植入系统内。
(4)数据利用最大化
通过法律监督综合数据中心(元数据中心)的建立,可以更好的为民事监督、刑事监督、行政监督、公益诉讼分析线索提供帮助,使得线索更进准。
(5)强大的自助搜索功能
通过构建elasticsearch全文检索库,使得搜索更加轻松,支持双要素比对搜索,如选择相关字段于另外的文书、卷宗内容比对检索,方便检察官日常需求。
应用案例:
法律监督综合研判平台
宝应县反家暴大数据法律监督平台
民事监督系统