《广东省省级政务信息化(2024年第一批)项目需求--广东省司法厅智慧法治大数据平台建设(一期)项目.docx》由会员分享,可在线阅读,更多相关《广东省省级政务信息化(2024年第一批)项目需求--广东省司法厅智慧法治大数据平台建设(一期)项目.docx(34页珍藏版)》请在三一办公上搜索。
1、广东省司法厅智慧法治大数据平台(一期)项目项目采购需求书Bl为面向中小企业预留项目;非面向中小企业预留项目;口该项目不适宜面向中小企业采购。本项目需求内容部分允许通过分包的形式面向中小企业预留。本需求适宜分包的内容:软件开发服务中的数据归集、数据处理、数据共享、数据管理、数据图谱等模块的开发服务。该部分预算为115.42万元。分包对象:口中小型企业回小微型企业1 .项目概况1.1. 基本信息1.1.1. 项目名称广东省司法厅智慧法治大数据平台建设(一期)项目。1.1.2. 采购人广东省司法厅。1.1.3. 项目总体目标本项目的总体目标是:围绕整合、共享、协同、服务的设计理念,通过整合信息资源,
2、建立交换机制,打通共享通道,最终构建广东省司法厅智慧法治大数据平台,实现司法行政数据资源的统一管理、智能共享、综合治理、智能分析等功能;实现司法行政机关与政府各部门之间、政法机关之间在授权范围内的数据交换和信息共享;实现基于“大数据”“人工智能”驱动的司法行政业务升级,大幅提升司法行政业务管理与应用能力与水平,实现“大数据、高共享、智能化”的司法行政信息化新格局。1.1.4. 服务地点广东省广州市。1.2. 项目背景为贯彻落实“十四五”司法行政科技创新规则及“数字法治智慧司法”信息化体系建设指导意见中关于探索司法行政领域的知识融合技术,增强“智慧法治”大规模数据汇聚融合能力的相关要求,本项目要
3、求坚持“深化治理、高效服务、运营增效”的工作思路,从治、管、服三个方面补齐短板,建立健全的司法厅智慧法治大数据平台体系,构建数据共享共治的“智慧法治”一体化联动体系,打造可靠、安全、高效的司法厅智慧法治大数据平台,全面支撑司法行政大数据建设应用工作。广东省司法厅智慧法治大数据平台建设(一期)项目数据采集来源主要涉及厅内部署的8个业务系统:广东省司法厅社区矫正一体化平台、广东省公证行业综合信息系统平台、广东律师管理系统、广东省司法厅法律援助事项管理平台、广东省公共法律服务网、一村(社区)一法律顾问工作管理系统、广东省12348呼叫中心、12348公共法律服务热线综合管理平台一综合管理系统。2 .
4、项目预算本项目总预算为283.35万元。其中,基础设施服务1.6万元,软件开发服务281.75万元。3服务期限本项目委托服务期限:(1)软件开发服务以合同签订之日为服务起始时间,服务期为12个月。(2)基础设施服务和系统业务运营服务以采购人确认的服务启动报审备案时间为服务起始时间,服务期为12个月。4.服务内容本项目服务内容主要包括基础设施服务、软件开发服务和系统业务运营服务,各项服务的详细内容如下:4.1. 基础设施服务基础设施服务主要是建设本平台需要的密码设备资源,包括国密安全浏览器、员工数字证书、智能密码钥匙(UKEY)等,具体要求和数量如下表所示:序号名称参数要求数量单位1国密安全浏览
5、器浏览器客户端,为终端设备提供支持SM2、SM3、SM4等国密算法的浏览器,保证页面访问的安全性。基于SS1.隧道,吞吐率29Mbps。15套2员工数字证书采用国家认可的权威第三方CA机构证书,提供国密证书签发和管理服务,应用于个人用户标识真实身份。15个3智能密码钥匙(UKEY)为政务信息系统提供密码运算、密钥管理功能的终端密码设备,应至少支持USB、SD、Dock、1.ighting.Bluetooth.NFC、音码、WiFi、IS07816IS014443等一种或多种接口;SM2密钥生成时间W5秒;SM2数字签名时间W500毫秒;SM3速度22KbPS15个4VPN网关服务基于SS1./
6、T1.S协议,提供通信数据机密性/保密性和完整性保护功能。提供VPN服务,用于远程业务系统访问,支持远程接入政务外网和政务云数据中心网络。含201项序号名称参数要求数量单位个VPN并发的1年服务。5服务器证书服务采用国家认可的权威第三方CA机构证书,提供国密证书签发和管理服务,应用于政务信息系统之间标识真实身份。含1年服务。1个6密钥管理服务根据密码接入规范和标准管理协议,为政务信息系统提供密钥生成、存储、更新、备份、恢复及归档等密钥全生命周期管理:1、并发请求数N100次/秒;2、密钥存储量210000个;1套7密码计算服务加解密服务:为政务信息系统提供应用级数据加解密、杂凑等密码运算服务,
7、实现信息的机密性、完整性、真实性和不可否认性保护。1、并发请求数2128次/秒;2、SMI215Mbps;3、SM2加密22300次/秒;4、SM2解密21000次/秒;5、SM4150Mbps;1套签名验签服务:基于数字签名、验证签名技术,为政务信息系统提供应用级数字签名、验证签名等服务。1、并发请求数2128次/秒;2、SMl215Mbps;3、SM2签名22300次/秒;4、SM2验签21000次/秒;5、SM3150Mbps;8时间戳服务基于公钥密码基础设施应用技术,为政务信息系统提供精准、安全和可信时间认证服务:1、时间戳支持并发量2100个/秒;2、时间戳签发280次/秒;3、时间
8、戳验证,150次/秒;1套9集成部署实施服务上述软硬件设施的集成部署测试等工作,同时配合项目其他部分需要的联调试运行测评等工作。1套上表中服务内容为采购人预估的密码软硬件设施服务,对于没有在表中列出,但为了保证本平台能通过商用密码安全性评估而需要配置的其他软硬件设施服务,供应商必须在投标时列明并将该部分费用包含在本项目报价中,采购人不再另行支付该部分费用。4.2. 软件开发服务广东省司法厅智慧法治大数据平台(一期)项目的定制软件开发服务主要围绕数据归集、数据处理、数据共享、数据管理展开工作,并对数据进行统计分析,从而提供联合查询、数据图谱、业务数据统计分析以及业务指标统计分析,具体开发逻辑如下
9、:1、通过对司法行政业务数据进行归集,建立原始数据库,为后续的数据管理与应用提供基础的数据支撑环境,并保证原始数据库与业务系统上传数据的一致性,防止数据篡改。2、根据实际需求,基于原始库数据形成共享数据库。保证共享数据库与业务系统上传数据的一致性,防止数据篡改。3、项目通过对原始库的进一步数据处理,构造出能够为应用提供服务的业务数据库。4、建立司法行政知识库管理体系,进一步完善业务数据库。5、在业务数据库的基础之上,进行数据管理,从而对数据进行盘点与标注。6、在业务数据库的基础之上,提供联合查询、数据图谱、业务数据统计分析以及业务指标统计分析。相关软件支持本地化部署,符合安全化要求,并尽量使用
10、开源代码,确保安全性及可用性,满足相关行业标准及国家标准。各部分的展现功能,可按照账号的级别、岗位、职务、业务类型等属性进行分级分类授权,使得不同类型的账号可看到不同的结果。4.2.1 J.数据归集421.1.1.数据源管理数据归集范围主要来源于广东省司法厅社区矫正一体化平台、广东省公证行业综合信息系统平台、广东律师管理系统、广东省司法厅法律援助事项管理平台、广东省公共法律服务网、一村(社区)一法律顾问工作管理系统、广东省12348呼叫中心、12348公共法律服务热线综合管理平台-综合管理系统这8个业务系统,业务涉及公共法律服务、刑罚执行等领域。除结构化数据信息归集外,还需实现半结构化、非结构
11、化数据信息归集,为数据智能化应用提供数据支撑。提供数据源配置信息管理功能,实现对需要进行数据归集源的基础管理能力,包括结构化数据源和非结构化数据源。数据存储结构按数据的类别分为结构化数据域信息、半结构化数据域信息和非结构化数据域信息三个逻辑的数据域。(1)结构化数据域信息用于保存由各业务系统抽取的关系型数据,这部分数据需基于数据资源平台所提供的关系型数据库组件来组织;(2)半结构化数据域信息用于保存从各业务系统或各下属单位抽取的半结构化数据,如XM1.格式、X1.S格式数据或文件,该类型数据需基于数据资源平台所提供的N。SQ1.数据库组件来组织;(3)非结构化数据域信息用于保存从各业务系统或各
12、下属单位抽取的非结构化数据,包括图片、音视频、文本等类型数据,该类型数据需基于数据资源平台所提供的分布式文件系统进行存储。非结构化数据和半结构化数据需在基础资源数据库中建立劫隹值息来记录该数据的来源和存储路径等,以明确数据版本,防止数据篡改。索引表主要以关系型数据形式存储在结构化数据域中。421.12数据归集任务提供对数据归集任务信息的配置功能,并提供相关的任务控制。提供迎宴机值思的配置功能,实现对数据归集调度机的运行参数配置,支持关联查看对应的数据归集任务。421.1.3.数据前置归集考虑到司法厅目前各系统建设时间、技术体系、架构设计等差异性,本项目需提供多样性的数据归集方式,包括数据接口归
13、集、数据抽取归集、ftp文件上传的三种方式,各系统可以根据自身特点选择合适的方式进行数据上报。4.2.1.1.3.1.数据接口归集系统提供数据归集接口的管理功能,实现数据归集接口信息的在线管理和发布,并以Web表单形式接口配置。支持与数据标准管理中的结构化元数据进行关联,可根据关联的元数据集接口数据归集到的数据归集元数据信息,并以此生成接口调用示例。支持自动生成接口文档信息。4.2.1.132.数据抽取归集对于部分已建设系统,支持直接连接原业务系统数据库或通过前置库间接连接的方式完成业务数据采集。系统可创建数据抽取任务信息,并可设置任务的启动和停止的状态控制。系统提供对数据抽取任务的任务运行信
14、息进行监控,可监控和掌握每个任务的执行情况,有无发生异常等,便于实现对抽取任务的运维管理。对于数据归集过程中发生的异常归集日志信息,应记录详细的错误日志信息,便于定位和分析错误发生原因。4.2.1.13.3.ftp文件归集对于半结构化、非结构化数据,支持通过ftp文件上传信息实现数据归集。4.2.1.2.数据处理数据处理主要是对原始数据库进行处理,通过建立严格的数据处理规则,对数据进行监控与治理,把不合格的数据标识并提醒出来,让业务人员根据实际需要进行处理,从而形成业务数据库,为后续的大数据呈现业务应用提供合格的数据支撑环境。421.2.1.数据资源编目将系统归集的数据进行分类分组,基于已规划
15、建设的数据资源成果,建设全省司法行政数据资源编目信息。4.2.1.2.1.1.目录管理系统提供目录管理功能,实现对目录管理信息基础管理能力。(1)目录编目功能,按照设定的元数据对共享信息资源和标准数据元进行目录编辑,并形成目录内容。(2)目录发布功能,发布信息资源目录和数据元目录。(3)目录查询功能,提供按目录名称关键字查询,或组合其他查询条件进行高级查询。4.2.1.2.1.2.斐源统计信息提供数据资源统计功能,根据实际需要进行资源统计信息。421.22数据标准管理制定统一的数据标准目录、元数据标准以及数据编码标准,基于国家标准、地方标准及本项目实际情况对这些标准进行人工管理及维护,为跨系统
16、、跨部门之间的数据通讯奠定了标准基础。4.2.1.221.元数据标准模型元数据是关于数据属性的数据,描述了数据定义和属性。主要包括业务元数据、技术元数据和管理元数据。在数据标准目录的基础之上,统一注册和管理各种资源库的元数据信息,形成元数据标准模型,方便在数据对象目录上查看数据结构的全生命周期信息。元数据标准模型应包括结构化元数据、非结构化元数据。4.2.1.2.2.1.1.结构化元数据提供结构化数据的元数据管理功能,实现结构化元数据信息的基础管理能力。4.2.1.2.2.1.2.非结构化元数据提供非结构化的元数据管理功能,实现非结构化元数据信息的基础管理能力。421222数据编码标准数据编码
17、标准是指针对数据的编码的定义,包括结构化数据的序列型的字段、非结构化数据中的可以序列化的特征。数据编码的定义应遵循国家标准、行业标准、地方标准、司法部标准、广东省司法厅标准。提供用于定义数据编码信息的管理利维护功能,方便用户完成数据字典的定义与维护管理。4.2.1.23数据质量管理数据质量是保证数据应用效果的基础。数据质量是描述数据价值含量的指标,数据质量的好坏决定着数据价值的高低。在ET1.或E1.T数据采集、转换、加载过程中,需要数据进行清洗,保证数据高质量产出。通过建立一套切实可行的数据质量监控体系,设计数据质量检查规则,加强从数据源头控制数据质量,形成覆盖数据全生命周期的数据质量管理。
18、通过配置各类数据质量的检查规则,实现规范性、完整性、唯一性、参考完备性、数据一致性、时效性、准确性。42123.1.数据质量规则库提供数据质量的检查规则库信息的管理功能,实现有效性规则、唯一性规则、完整性规则、一致性规则。4.2.1.2.3.1.1.有效性(1)字段长度有效对字段内容长度是否在有效性范围的监控指标,可配置最小长度,最大长度。如mobile手机号11位;身份证18位或15位是否满足配置监控长度,不等于配置长度范围,视为脏数据。(2)字段内容有效对字段内容是否在满足正则表达式指定内容格式的监控指标。如对name姓名含有中英文结合;身份证号含有中文;手机号IlllllIllll等异常
19、数据监控。(3)字段数值范围有效对数值类型字段是否在有效性值范围的监控指标,可根据业务场景配置该字段值范围最小值,最大值。如age年龄,超过100O岁等。(4)枚举值个数有效对枚举值字段的可枚举值种类个数的监控指标,可配置、=、=、!=与期望值的比较。如银行储值卡在“消费、转账、提现三种业务类型,枚举值个数某天少了一种或多种业务类型,可能是上游业务系统出现问题,或数据采集时丢失数据。(5)枚举值集合有效对枚举值字段的可枚举值种类内容集合的监控指标,可配置“包含、相等、不包含”与期望值集合的比较。如银行储值卡在“消费、转账、提现三种业务类型,出现了“消费、转账、贷款”三种业务类型,虽然枚举值个数
20、也是3种,但是枚举值内容有误。4.2.1.2.3.1.2.唯一性(1)是否重复对主键是否存在重复数据的监控指标。出现重复数据导致重复计算等问题,也支持联合主键唯一性监控。4.2.1.2.3.1.3.完整性(1)字段是否为空或NU1.1.对字段内容是否存NlJ1.1.的监控指标。(2)非结构化文件文件是否完整,是否有被损坏。4.2.1.2.3.1.4.一致性表级别一致性检查,表级别质量监控指标,根据提前定义的数据标准,基础元数据字段命名规范,术语命名规则、字段COmCnnt规范、数据类型规范;指标元数据字段命名规范,术语命名规范、字段Comennt规范、数据类型规范,计算口径是否统一等规范。对表
21、结构字段、字段comment.数据类型等的是否一致的监控检查。4.2.1.2.3.2,数据质量规则配置提供在启动数据归集任务之前对数据质量规则的配置功能,在配置时应指明业务系统、指明数据表(是否分区表/分区格式)、指明监控字段/监控表名、指明使用哪条规则、指明监控规则的值、指明启用状态。421.2.33数据质量日志提供数据质量日志查阅功能,日志应明确指出指标是否合格,对不合格生成还应生成质量告警。0.4. 数据质量报告提供以业务系统为维度的数据质量报告查阅功能,报告数据质量的结果。0.5. 质量告警提供质量告警功能,当有质量告警时,需业务人员介入检查是否需要调整质量规则配置,并按照最新的质量规
22、则配置进行再次启动质量检查。0.6. 数据安全管理42124.1.数据安全定级根据数据的安全保密要求对数据进行安全定级信息配置,根据实际需要可以对不同等级数据采用差异化的脱敏配置与权限访问控制,从而保隙数据安全的使用。421242数据访问权限基于数据资产,对数据进行精细化的数据访问授权,对数据访问权限信息的管理,以防止数据滥用,且所有的终端、应用,或者物理用户访问数据时,都需要经过数据权限模块完成身份认证、访问控制过程。4.2.1.2.4.3.数据脱敏数据采集前,数据提供方系统对一些敏感但不应公开的数据进行脱敏。在数据采集过程中,对大数据中的数据进行处理时,需要将敏感信息进行脱敏。系统支持多种
23、脱敏规则信息的配置。42124.4.数据日志系统提供对数据的服务调用、服务操作等使用行为进行日志记录能力,实现对日志审计信息的管理。4.2.1.25数据版本管理系统提供数据的版本管理功能,实现对已发现的不合格数据的处理后,均要形成一个新的版本,并记录到业务数据库中,从而满足对数据的溯源追踪需要。4.2.1.3.数据共享数据共享,是建立在原始数据库的基础之上所形成的一份可针对司法行政部门内进行的共享数据库。共享数据库与原始数据保持一致,所存储的数据不会被业务应用改变。421.3.1.数据资源中心421.3.1.1.数据共享中心根据数据编目的目录体系,建立全省司法行政数据资源的数据共享中心桌面,向
24、全省各级司法行政单位提供浏览和查询能力。支持数据分类查询,显示每个分类的数据资源总量及数据资源共享的权限范围。支持按资源名称模糊搜索。数据共享中心桌面展示数据资源申请使用情况,支持按不同维度进行统计分析并在桌面展示。421.3.12数据资源申请省司法厅和各级司法行政单位可在数据共享中心里申请获取数据资源共享服务,提交给省厅审批。数据资源申请信息中需包含申请的数据资源目录清单、申请理由、申请单位及联系人信息等。支持一次性申请多个数据资源。资源申请提交成功后,系统将生成一个唯一的申请单号,申请人可凭单号查看申请审批进度,下载接口文档。421.3.1.3.数据资源审批支持数据资源申请信息的审批功能,
25、支持配置数据资源审批流程,审批部门按照流程进行各个流程环节信息的审核,并支持审批进度查询。4.2.1.3.1.4.分配共享接口资源申请审批通过后,系统管理员将根据申请人的数据资源申请内容,给申请人分配共享接口的共享接口配置信息,并可自动生成电子版的接口使用说明文档。申请者可凭申请单号下载该文档,用于辅助接口开发。4.2.1.3.2.系统接入注册4.2.1.3.2.1.账号注册管理系统向第三方业务系统提供接入注册功能。为保隙木系统的数据安全,只有经过接入注册的第三方系统才可使用本系统提供的各类数据接口服务。系统管理员根据资源申请工单进行账号注册。系统提供接入账号注册信息的管理,实现只有注册后且为
26、“启用”状态的系统才可以访问数据接口服务。支持为每个接入系统分配独立的密钥,本项目要求接入系统访问数据接口服务时必须安全验证,并校验访问者的IP是否合法,确保本项目的数据安全性。421.322.接口权限分配系统提供控制每个接入系统的接口访问权限控制功能,系统管理员根据资源申请的内容,分配数据接口权限信息。系统支持对操作日志信息的查询能力。4.2.1.33数据共享服务421.3.3.1.共享规则配置本项目应提供因数据共享而需要的规则配置功能,可以实现对数据共享及数据推送规则的配置。支持阈值配置,以防止数据超量共享,并在异常情况发生时及时生成告警。数据共享规则:配置共享数据的规则,支持暂停推送功能
27、。数据推送规则:配置推送规则,支持暂停推送。4.2.1332.数据共享接口本项目提供便捷的数据信息共享接口,面向全省各司法行政单位提供数据共享服务。支持数据共享接口信息的在线管理和发布。系统提供Web表式单数据共享接口信息配置功能。支持数据接口与数据资源的关联,可快速提取数据资源的元数据自动填充为接口数据体元数据,生成接口调用示例。支持接口权限控制。支持自动生成接口文档。本功能须在政务外网和司法专网均要部署一套接口服务,以满足不同网络的第三方业务系统的调用。4.2.1.3.3.3, 自定义数据推送为了实现与公检法监等部门进行跨部门数据的共享,木项目提供自定义数据推送规则的配置能力,可以自主配置
28、自定义数据推送规则信息,配置与定制可推送共享数据(包括结构化和非结构化)、共享的规则、数据脱敏规则等,规则配置后,系统根据规则推送到公检法监指定的前置机。4.2.1.3.3.4, 共享日志系统提供共享日志管理功能,记录每次共享的日志信息,同时具备记录所共享的数据,从而形成可追溯数据的依据。4.2.1.4.数据管理421.4.1.数据综合查询系统提供数据的综合查询功能,实现通过对数据目录的每类数据进行综合的过滤查询,从而检索出所需要查询的综合数据信息。421.42数据标注为满足对不同状态的数据管理需要,结合业务需要对数据进行标注,作为数据的摘要提示内容,方便数据的使用者对不同状态的数据的快速识别
29、与定位。4.2.1.4.2.1.标注存彳诸数据有不同的存储形态,包括结构化普通数据和非结构化数据,其中非结构化数据包括普通文本文件、多媒体数据文件(图像、视频、语音数据)、对象文件(CSV、JSON文本数据),需要对这些不同格式的数据结合业务的需求进行标注。4.2.1.4.2.1.1.结构化标注结构化数据标注信息:进行结构化数据的数据标注,并通过专门设计的结构化表,来存储所标注的内容,并且通过这个结构化表可以清晰、快速定位到所对应哪个结构化普通数据。4.2.1.4.2.1.2.非结构化数据标注非结构化数据标注信息:进行非结构化数据的数据标注,并以文件目录的形式存储标注的内容。4.2.1.422
30、.数据标注系统为操作者提供手工数据标注的功能,手工标注可以对包括结构化普通数据、普通文本文件、多媒体数据文件(图像、视频、语音数据)、对象文件(CSV、JSON文本数据)进行标注。421.4.3.数据盘点针对项目所汇聚的数据资产进行综合盘点与分析,形成可视化的数据资产运营情况。421.4.3.1.数据资产全景为实现对数据资产的全景管理,系统提供数据全貌信息呈现能力,根据业务的需要,可统计相关的数据量等信息内容。4.2.1.432. 数据资产变化情况系统提供数据资产变化情况的呈现能力,实现对资产目录的数据增长情况信息进行量化统计。4.2.1.433. 数据资产采集情况系统提供数据资产采集情况的呈
31、现能力,实现对数据的采集展开数据资产采集情况信息的统计。4.2.1.434. 数据资产共享情况系统提供数据资产共享情况的呈现能力,实现对数据资产共享情况信息进行综合分析。4.2.1.435. 行政知识库目前省司法厅尚未将司法行政相关知识内容形成统一管理的知识管理体系,无法实现司法行政知识的内部迭代与分享。在实际工作中,往往存在着需要大量需要使用到知识的业务场景,特别是需要用到跨业务使用的业务场景当中,这些是无法从现有的单独系统中获得支持,而是需要在收集到各单独的业务系统知识后,对知识跨业务关联后进行使用。本期项目将建设知识库系统,收集各业务系统现有知识库中的结构化数据,并将各业务系统知识库的数
32、据进行高效统一的整合与汇编,打通各业务系统间的知识通道,方便跨业务部门知识的调用与管理。4.2.1.435.1. 管理421.5.1.1.知识管理系统提供对已收集的知识(含知识采集来源和知识采编来源)的按分类目录进行有效管理,实现对知识信息的管理能力。421512发布管理管理员对知识审核校验之后,需要对知识进行发布管理,并支持发布后进行相关的管理操作。4.2.1.435.2. 采集421.521.网络抓取源配置系统提供针对知识信息进行网络抓取源的规则配置功能,实现对网络抓取源规则配置信息的配置能力,并根据配置实现后台自动抓取知识信息。4.2.1.435.2.2. API接口报送收集通过提供统一
33、的APl接口报送收集功能,向全省各级司法行政单位提供可能通过APl接口向木平台报送知识库的途径。本功能须在政务外网和司法专网各部署一套接口服务,以满足不同网络的第三方业务系统的调用。4.2.1.435.2.3. 审核无论是通过网络信息抓取到的知识,还是通过接口报送上来的知识,均需要进行人工浏览的审核,采集电核通过后即可归档知识并可开始知识的生命周期管理。4.2.1.435.3. 采编系统提供知识采编管理功能,通过人工采编工作任务的形式来补充收集不足部分的业务知识。4.2.1.435.3.2. 发起系统的知识库运营人员向指定的业务部门和人员发起知识采编任务,实现知识采编任务信息的管理能力。4.2
34、.1.435.3.3. 上传当采编任务人员收到采编任务后,根据采编任务的要求对知识进行在线填报与上传,填报和上传的采编知识信息。0.3. 采编审核采编任务人员上传采编知识后,系统知识库运营人员可以对上传的知识进行采编审核,审核不通过的退回给采编负责人重新上传,审核通过的知识可开始知识的生命周期管理。4.2.1.435.4. 务关联421.5.4.1.标签管理系统提供对知识的标签管理,为知识的跨业务关联提供基础支撑数据。实现对知识标签信息管理能力。4.2.1.55知识统计分析42155.1.知识资产统计系统提供知识资产统计报表,知识资产统计信息将按实际需要进行统计分析。4.2.1.5.5.2.
35、知识采集统计系统提供知识采集统计报表,知识采集统计信息将实际需要统计知识采集情况。4.2.1.5.5.3. 跨业务关联统计系统提供跨业务关联统计报表,对已进行跨业务关联的知识进行关联情况的分析,跨业务关联统计信息将根据实际的业务需要统计相关内容。4.2.1.5.5.4. 知识热点分析系统提供知识热点分析报表,实现根据实际的业务需要进行知识热点分析信息分析。4.2.1.5.6.知识应用421.5.6.1.知识地图根据知识分类目录和分类构建可视化知识地图,实现可视化知识地图的展示。4.2.1.6.联合查询421.6.1.联合查询算法4.2.1.6.1.1.查询词分析联合查询最重要目的是为用户提供准
36、确全面的联合查询结果,当联合查询接收到用户的查询词后,需要进行查询词分析,通过查询已缓存的历史数据,则可以直接将搜索结果返回给用户。421.6.1.2.检索语法引擎系统根据用户的查询词,通过检索语法引擎解释出检索语法信息,目的是正确得到机器能识别的检索数据索引语言。4.2.1.6.1.3.数据索引系统建立数据索引体系,通过映射智慧法治大数据平台的数据,并从中抽取索引项构建不同类型的索引信息,从而能够正确、快速、方便的提供联合查询算法的核心搜索逻辑,包括正排索引信息及其他必要的索引信息。4.2.1.6.2.跨业务关联查询跨业务关联查询是指用户的查询意图是想查询出多个存在关联的数据结果。建立多维度
37、的跨业务关联分析信息,根据用户的联合查询内容进行查询关联内容推荐。对于非结构化数据,可通过数据标签进行关联分析查询。421.6.3.热搜词库配置梳理热点搜索关键词,并配置到热搜词库信息,实现用户进行搜索时,可以方便用户快速推荐查找所需搜索信息。421.6.4.联合查询应用4.2.1.64.1.机构联合查询系统提供包括司法行政单位、司法从业机构的联合查询,机构联合查询信息除包括查询意图中的机构信息之外,还会同步查询出该机构关联的业务数据信息。421.6.4.2.人员联合查询系统提供包括司法行政人员、司法行政从业人员、司法行政业务申请人的人员联合查询,人员联合查询信息除包括查询意图中的人员信息之外
38、,还同步搜索出该人员关联的业务数据信息。4.2.1.6.4.3.知识库联合查询系统知识库联合查询,根据关键字快速查询出相匹配的知识库内容联合信息。421.6.5.服务接入管理4.2.1.6.5.1. 接入申请联合查询模块向第三方业务系统以接口的形式提供接入查询的服务,第三方业务系统在进行使用接口服务调用前,需要进行接入申请,接入申请信息通过审核后,系统将分配接入的准入信息,第三方业务系统在每次调用联合查询服务时,均需要传递准入信息进行认证与鉴权。4.2.1.6.5.2. 联合查询权限管理在对第三方业务系统分配接入的准入信息后,还需要配置其联合查询的权限范围及限制条件信思,权限范围包括可联合查询
39、的业务数据范围和知识库数据范围,而限制条件则包括联合查询关键字过滤、返回的敏感信息屏蔽适用的配置规则。4.2.1.6.5.3. 单管理系统提供黑/白名单管理功能,可以实现对黑/白名单配置信息的增加、删除、修改、查询操作,满足第三方接入业务系统的系统级别访问控制。其中黑名单的接入应用将无法使用联合查询服务API,而白名单的接入应用将无限制调用。4.2.1.6.5.4. 关键字过滤配置系统提供关键字过滤配置功能,可以实现对关键字过滤配信息进行增加、删除、修改、查询操作,若第三方业务系统通过联合查询接口进行联合查询,关键字是系统中配置的过滤关键字时,系统将会过滤掉本次搜索请求,并返回相应的提示。4.
40、2.1.6.5.5. 敏感信息屏蔽配置系统提供针对搜索返回结果内容的敏感信息屏蔽配置功能,对敏感信息屏蔽配置信息进行增加、删除、修改、查询操作,实现当第三方业务系统通过联合查询接口进行搜索时,系统联合查询出来的信息存在已配置中的敏感信息时,接口将会对返回的内容进行敏感屏蔽。系统按需预留相关接口,以满足第三方业务系统的调用。4.2.1.7.数据图谱数据图谱主要是服务于实际的业务,所呈现出来的内容反映的是数据客观的、全生命周期的变化过程的数据关系图,以辅助运营人员对法治大数据的研究。421.7.1.公共法律服务知识问答图谱分析针对公共法律服务知识问答业务,系统利用在已建立在业务数据库之上的知识库和
41、公共法律服务数据进行智能关联分析,关联得出公共法律服务知识问答信息的关系图数据。通过采用Al基础支撑平台的有关功能和模型,公共法律服务知识问答图谱,可以发现公共法律服务的热点咨询内容,探索各类不同咨询群体的法律服务需求变化规律和潜在变化趋势。按实际的业务需要,与“粤智慧”可视化开发能力等省有关平台实现数据对接,实现对省平台的可视化能力复用。4.2.1.7.2. 律师执业能力图谱分析针对律师管理业务,系统以律师基本信息为切入点进行智能关联分析,关联得出律师擅长执业服务能力信息图谱。通过律师执业能力图谱中的数据变化过程,可以总结律师执业能力的发展过程,以及发现律师执业能力发展的特点。按实际的业务需
42、要,与省有关平台实现数据对接,实现对省平台的可视化能力复用。4.2.1.7.3. 社区矫正对象图谱分析针对社区矫正对象业务,系统利用社矫对象基本信息进行关联分析,关联得出社区矫正对象信息图谱。通过社区矫正对象图谱来呈现社区矫正对象的业务数据全生命周期的变化过程,并辅助发现社矫对象个体业务特点。按实际的业务需要,与省有关平台实现数据对接,实现对省平台的可视化能力复用。4.2.1.8.业务数据统计分析系统为业务部门提供业务数据统计查询入口,根据不同的业务用户,为其提供合适的查询入口。业务数据统计分析包括司法行政人员机构“一张图”、公共法律服务专题统计分析、刑罚执行专题统计分析。421.8.1.司法
43、行政人员机构“一张图”构建全省司法行政人员机构“一张图”,结合全省司法行政人员与机构群体数据的变化过程,对全省各级司法行政单位的司法行政人员机构信息、司法行政人员数量信息、司法行政机构数量信息进行可视化展示,以辅助运营人员和业务人员发现全省司法行政人员机构的发展特点与发展趋势。按实际的业务需求,与省有关平台实现数据对接,将相关信息同步到对应平台。4.2.1.8.2.公共法律服务专题统计分析本期项目通过对公共法律服务相关的业务数据进行分析,构建公共法律服务业务专题信息的统计分析应用,实现对法律服务资源信息、法律服务咨询信息、公证服务信息、村(社)法律顾问服务信息的可视化展示。公共法律服务专题统计
44、信息分析需基于当前现有成熟、主流的开源自然语言处理算法模型,结合Al基础支撑平台的有关功能,基于人工经验的积累,结合公共法律服务的业务打标数据,基于多种不同维度和视角对公共法律服务咨询相关数据进行细化自动分类,形成若干分类数据空间,初步形成各不同分类空间之间的潜在可能的关联关系,从而辅助运营人员探索公共法律服务潜在的不同分类数据变化、业务发展规律。按实际的业务需求,与省有关平台实现数据对接,将相关信息同步到对应平台。4.2.1.83刑罚执行专题统计分析本期项目通过社区矫正业务数据和社区矫正对象数据象构建刑罚执行业务主题信息应用,实现对社矫对象业务量信息、社矫对象结构分析信息、对象地区分析信息、
45、入矫、解矫趋势信息、社区矫正机构数量信息的可视化展示。刑罚执行专题统计分析的数据是基于刑罚执行的各类群体为对象所展开的分析,如基于某个年龄段所关联的不同罪名犯罪社矫对象进行探索分析。按实际的业务需求,与省有关平台实现数据对接,将相关信息同步到对应平台。4.2.1.9. 业务指标统计分析4.2.1.9.1. 司法行政年度指标统计分析构建司法行政年度指标统计分析应用,基于所归集的司法行政业务指标数据,统计并呈现强行政年度指标完成情况信息。司法行政年度指标统计分析主要是对所归集的数据质量、数据上传情况等进行统计分析,辅助运营人员进行数据管理。按实际的业务需要,与省有关平台实现数据对接,实现对省平台的
46、可视化能力复用。4.2.1.9.2. 公共法律服务情况统计分析构建公共法律服务情况统计分析应用,基于所归集的公共法律服务数据,统计并呈现公共法律服务情况信息。公共法律服务情况统计分析主要是对所归集的公共法律服务数据,辅助运营人员对公共法律服务的数据质量进行判断。按实际的业务需要,与省有关平台实现数据对接,实现对省平台的可视化能力复用。4.2.1.10. Al基础支撑平台4.2.1.IOl.自然语言处理(N1.P)能力421.10.1.1.ASR语音转写实现语音转写,支持普通话语音转写和粤语语音转写,并支持实时转写、录音转写,ASR语音转写并发数5路,为业务数据统计分析和业务指标统计分析提供智能
47、化辅助。4.2.1.10.1.2. N1.P模型库聚合主流优质预训练模型,提供覆盖N1.P多场景的模型库,可满足灵活定制的开发需求。模型支持文本摘要模型、信息抽取模型、情感分析模型、语义检索模型、智能问答模型等端到端任务模型算法,可根据实际业务场景选取使用,从而为业务数据统计分析和业务指标统计分析提供智能化辅助。4.2.1.10.1.2.1. 文本摘要模型文本摘要模型是自动地将输入文本转换成简短摘要,为用户提供简明扼要的内容描述。本项目的文本摘要将根据实际业务需要应用于对各类段落篇章进行摘要提取,可根据实际业务场景选取使用,为业务数据统计分析和业务指标统计分析提供智能化辅助。4.2.1.10.1.2.2.信息抽取模型值且抽取模型是利用计算机从自然语言文本中提取出核心信息,满足基于对一段长文本进行抽取,从而抽取出一段简短的、可被理解的文本。根据实际需求,通常应用于有特定的长文木信息抽取场景,可根据实际业务场景选取使用,为