电力大数据建设方案.docx

上传人:李司机 文档编号:6842292 上传时间:2024-03-01 格式:DOCX 页数:50 大小:1.17MB
返回 下载 相关 举报
电力大数据建设方案.docx_第1页
第1页 / 共50页
电力大数据建设方案.docx_第2页
第2页 / 共50页
电力大数据建设方案.docx_第3页
第3页 / 共50页
电力大数据建设方案.docx_第4页
第4页 / 共50页
电力大数据建设方案.docx_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《电力大数据建设方案.docx》由会员分享,可在线阅读,更多相关《电力大数据建设方案.docx(50页珍藏版)》请在三一办公上搜索。

1、电力大数据建设方案目录1背景51.1 建设背景(国家)51.2 建设背景(地电/发电企业)52 建设目标53 建设原则和策略74 建设方案84.1 技术方案84.1.1 总体架构84.1.2 技术架构94.1.3 数据架构104.1.4 基础平台114.1.4.1 CDH114.1.4.2 MPP124.2 建设内容144.2.1数据模型管理144.2.1.1元数据管理144.2.1.2血缘关系154.2.1.3元数据自动变更164.2.2数据资产管理164.2.2.1数据资产目录164.2.2.2模型溯源分析164.2.2.3系统数据接口164.2.2.4数据负面清单174.2.3数据质量管

2、理174.2.3.1规则库管理174.2.3.2规则配置184.2.3.3规则执行184.2.3.4质量报告184. 2.4数据服务开发184.1.1.1 数据服务监控184.1.1.2 数据服务目录管理194.1.1.3 数据服务配置194.1.1.4 服务市场214.1.1.5 应用管理214.1.1.6 申请管理224.1.1.7 审核管理224. 2.5非结构化数据234.1.1.1 文件目录管理234.1.1.2 文件批量上传244.1.1.3 文件管理244.1.1.4 文件查询254.1.1.5 数据统计264.1.1.6 智能搜索264.1.1.7 词库管理274.1.1.8

3、标签定义284.1.1.9 同步日志284.2.6 数据分析组件284.2.7 机器学习平台304. 2.7.1可视化建模305. 2.7.2模型管控316. 2.7.3算法组件314.2.8 数字产品超市324. 2.8.1数据服务目录325. 2.8.2数据服务市场324.2.9 电力数字化产品334.2.9.1大数据计算类产品334.2.9.2数据挖掘分析类产品344.2.10平台集成374.2.10.1数据采集374.2.10.2数据清洗384.2.10.3任务调度385 大数据平台实施方案395.1 总体规划395.2 第一阶段建设范围395.3 第二阶段建设范围405.4 第三阶段

4、建设范围416 软硬件部署方案416.1 总体规划设计416.2 物理拓扑规划436.2.1 管理区规划说明436.2.2 数据区规划说明436.3 软件组件部署规划436.3.1 大数据基础软件436.3.1.1 HadOOP软件436.3.1.2 MPP软件466.3.1.3 关系数据库软件476.3.2 大数据应用开发软件476.4 服务器角色与命名规划476.5 IP地址规划481背景.建设背景(国家)近年随着国家新型基础设施建设战略发布,重点发力于科技端的基础设施建设,尤其在大数据中心、人工智能、工业互联网等领域以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需

5、要,提供数字转型、智能升级、融合创新等服务的基础设施体系。电网运行管理系统于2015年开展建设,至今各功能模块逐步完成建设并正式上线应用,主要负责业务协调、流程管理类工作,主要的功能模块分为并网管理类、运行风险管理类、运行计划管理类、运行控制管理类、运行评价与改进类、二次系统管理类等,基本涵盖了调度域全部的业务管理工作。目前系统运行良好,与多个横向业务应用系统协调应用。运行监视和控制类工作主要由电网运行控制系统负责,从2004年至今,完成了省级主站和地级主站系统的建设。主要的功能模块分为稳态建设类、动态监视类、环境监视类、在线预警类、在线计算类等。1.2建设背景(地电/发电企业)需根据地点/发

6、电企业自身情况补充2建设目标以需求为导向,重点提升数据资产管理能力、数据接入整合能力、数据共享分析能力、基础组件支撑能力四个方面能力,有效支撑营配贯通、多维精益管理、数字化审计、智慧供应链、供电服务指挥、网上电网、基建全过程数字化等业务开展。基于大数据平台的数据价值共享平台建设涵盖数据资产管理、数字产品超市、数据质量治理、数据分析组件、数据服务开发五方面。以“数据透明”、“数据准确”、“数据共享”为基础,发挥大数据平台价值,支撑各专业应用构建。通过建立规范的数据资产目录、实现数据的快速检索,解决数据“不知”的问题;明确数据存储及数据交换标准,提升数据使用质量,解决使用“不对”数据的问题;通过数

7、据融合共享体系的建设,实现数据的跨部门共享,解决数据“不给”的问题,构建数据资产透明可控的大数据平台。具体包括以下方面:1)基础组件支撑能力:开展基础组件支撑能力提升,优化完善大数据平台支撑平台技术架构,提升基础平台技术支撑能力。2)数据接入整合能力:开展数据接入整合能力提升工作,实现多维度、多类型数据的高效汇集,支撑公司数据融通共享、分析挖掘和数据运营。3)全面掌握数据资产现状:对数据家当进行全面盘点,形成数据地图,为业务应用和数据获取夯实基础。从资产化管理和展示数据的角度出发,数据地图作为数据资产盘点的输出物之一,帮助业务人员快速精确查找他们想要的数据。其次,数据地图作为企业数据的全盘映射

8、,帮助数据开发者和数据使用者了解数据,并成为对数据资产管理进行有效监控的手段。4)提升数据质量:通过建立一套切实可行的数据质量监控体系,设计数据质量稽核规则,加强从数据源头控制数据质量,形成覆盖数据全生命周期的数据质量管理,实现数据向优质资产的转变。5)数据共享分析能力:开展数据共享分析能力提升,实现跨专业数据共享分析服务统一构建,支撑跨部门、跨层级数据共享分析应用,逐步积累沉淀形成共享数据分析服务。6)数据价值持续释放:存储和管理数据的最终目的是实现数据的价值,数据资产化将数据作为一项资产,并通过一个持续和动态的全生命周期管理过程,使数据资产能够为企业数字化转型提供源源不断的动力。从企业高管

9、到业务人员及技术人员,全员都要以持续释放数据价值为理念来重视数据资源管理工作,建设现代化数据平台、引入智能化技术,确保数据资产管理系统平台持续、健康地为数据资产管理体系服务。3建设原则和策略大数据平台的建设既要充分考虑当前与各系统联动分析的现实需要,也要为今后的系统升级、数据整合等打好技术基础。1)先进实用,注重实效系统建设应尽可能采用先进的技术和产品,确保系统的高可用性、高性能、高可靠、高安全和可扩充性。同时要以实用为目标,针对实际问题,符合实际情况,解决实际问题,追求实际效果。2)规范性包括业务规范、开发规范、术语规范和数据规范等方面。应用系统的开发要符合软件设计开发的标准与规范,在开发过

10、程中采用的技术和工具应当尽量符合工业标准,在没有可依据的工业标准的情况下,应采用事实标准或主流的开发技术;在应用系统中使用到的电力行业的术语等应符合国家及行业标准;数据流转、处理按照统一规范进行。3)充分利用原有资源,避免重复投资在项目建设中应充分利用原有计算机、网络、数据等系统资源,融合已有电力应用系统,节省系统建设投资。注重总体规划,加强资源整合,巩固和发展以数据挖掘为主导的信息化持续发展局面。抓住关系全局的重大应用,通过应用推进信息化。避免盲目跟风,把握信息化发展的主动权。4)安全性和可靠性对主要数据加密,并运用先进的访问控制、身份认证等技术防止非法用户入侵;保证系统在异常情况下的正确可

11、靠运行。对于机密数据的传输,要求能保证的传输性安全。5)数据的完整性和一致性数据在各个应用系统中的采集、存储、传输和处理保持完整和一致。数据能实时传输,避免因传输延时造成数据不一致现象。4建设方案4.1 技术方案4.1.1 总体架构建立一套统一的系统运行领域大数据基础设施,为大数据平台、智能应用和综合展示等提供软硬件、网络和安防支撑环境。构建系统运行领域大数据中心,完成EMS和OMS等系统运行数据、气象数据、外部数据等多源数据采集清洗,实现跨专业系统运行领域业务数据融合。建立数据标准体系、唯一准确数据来源,提供数据综合治理和数据共享等服务。搭建大数据智能应用服务支撑平台,实现快速开发平台、智能

12、报表管理平台等支撑服务。开展大数据智能化生态应用研究,结合生产运行应用场景,研究主配网综合停电数据分析、负荷精准预测分析、稳定断面负载率智能自动分析和线路故隙跳闸智能告警等典型智能应用,打造一个大数据智能应用生态价值链。建成综合展示平台,实现公司运营、系统运行、日常生产等不同维度和PC、大屏、移动等不同终端的可视化展示,贯通网省地数据,完成中心领导、部门领导和专责不同层面按需自定义动态综合展示。4.1.2 技术架构为应对电网大数据中心急剧增多的海量数据,及提升系统的处理效率、缩短运算时间及应用响应时间、提升用户体验,项目采用大数据技术框架。大数据技术具有分布式及并行化等关键技术特征。大数据系统

13、是由多个分布的节点组合而成的集群通过网络连接提供服务及能力,以群体合力的方式提供服务及动力。由于具备分布式特征,大数据系统从机制上便于进行集群横向扩展,规模可以动态伸缩,满足应用和用户规模增长的需要。在分布式的基础上,集群各节点均可以提供服务能力以并行处理的模式提供能力,具备高性能高可用的特征。分布式文件存储系统提供无限存储能力,很好适应业务数据的快速增长,而且支持存储多种非结构化格式数据,并提供高冗余的存储能力,提高数据安全及访问能力。分布式并行处理系统将不同地点的或具有不同功能的或拥有不同数据的多台计算机用通信网络连接起来,在控制系统的统一管理控制下,协调地完成信息处理任务的计算机系统。本

14、系统采用分布式并行处理系统提高数据处理效能、提升客户感知。4.1.3数据架构数据服务应用系统支撑应用支撵各生产系统数据应用分析层汇总表支撑应用高效性能的轻度汇总模型统一容器事件发电设备保护设备共享层输变电设备自动化设备设备监控稳控装置类历史溯源长期存储,追溯数据来 源,屏蔽对源系统的影响跟据数据实时性要求,采 用不同的技术,确保数据及时性及一致性保障数据唯性标准转换编码统一、语义统一、字段长度、类型、显纲等统一,保障数据一致性大数据平台以电网容器、设备、外部环境等作为数据对象,采用维度建模方法,构建面向多业务主题的分层架构体系,提供元数据维护、查看功能,能够直观展示数据仓库的结构及版本信息。数

15、据仓库结构维护实现大数据平台数据仓库的整体分层架构设计的维护与展示,提供数据层级关系及层级内数据库信息的清晰、直观展示,包括源数据层、同步层、统一层、分析层等功能。源数据层:数据源来自多系统的数据源,在大数据平台中包括但不仅限于OMS、EMS、WAMS、TMR、气象、配电自动化等系统产生的数据。同步层:作为源端系统1:1的暂存层,为统一层数据的清洗、融合准备好生数据。统一层:按照电网对象、数据主题的维度对同步层数据重新组织,同时对数据进行加工处理转换为熟数据,形成统一、规范、标签化的数据集合。分析层:面向各个应用,抽取统一层中公共的业务数据进入分析层,根据数据和应用特性建立分析层数据库表。分析

16、层直接面向分析和BI展示,表设计上采用业务定制化特性。4.1.4基础平台采取CDH(CloUderaSDistributionIncludingApacheHadoop,简称CDH)+MPP(MassivelyParallelProcessing,大规模并行计算)数据库的混搭架构。通过一系列的ETL工具和工作流管理界面,将存储在文件、关系型数据库、实时数据流(如设备syslog信息)等各类数据源中的结构化数据、非结构化数据、半结构化数据采集到大数据集群中。其中,高价值的结构化数据存储在MPP数据库中,非结构化数据、半结构化数据、低价值密度的结构化数据存储在HDP中。然后通过批处理MaPRedU

17、ce、流计算Storm、混合计算Spark等计算框架,以及高性能、高SQL兼容度的SQL引擎,辅以BI(BusinessIntelligence,商业智能)展示和机器学习等工具,为上层应用程序提供标准的JDBC/ODBC/REST接口、多种语言的编程API和DaaS接口。基于大容量存储、高性能计算和分析能力,可以开发各行业的大数据应用程序。4.1.4.1 CDH支持以CDH作为大数据平台,完成数据中台建设及数据应用开发。CDH(安装部署工具)Oozie(作业流调度系统)(相逢延捍会)一d33xoozHIVE H mpaa StOnTl H Kafka . Spark H FlinkMapRed

18、uce(离线计算)内存计舞doobsYARN(分布式计算框架)HDFS(分布式存储系统)OJEnHCDH是一个提供全面的数据存储和处理引擎的商业发行版本。它主要包括了几大核心:数据接入和共享工具(Flume,SqOOP以及ETL)、分布式文件系统(HDFS),分布式开源数据库(HBaSe)、资源调度管理系统(YARN),分布式批处理框架(MaPRedUce)、数据仓库工具(Hive),大规模并行SQL分析处理引擎(HAWQ),分布式搜索引擎(Solr)、分布式内存计算引擎(Spark)o4.1.4.2MPP4.1.4.2.1GBase8a图GBase8aMPPCluster产品架构图GBase

19、8aMPPCluster采用MPP+SharedNothing的分布式联邦架构,节点间通过TCP/IP网络进行通信,每个节点采用本地磁盘来存储数据。实现非对称部署,分布式管理集群和分布式调度集群部署在一个集群。分布式存储集群部署在另外一个集群。系统中的每一个节点都是相对独立的、自给的,整个系统中不存在单点瓶颈,具有非常强的扩展性。由于没有资源共享,增加节点就可以线性地扩展数据容量和计算能力,可以从几个节点扩展到上百节点,满足业务规模增长的要求。GBase8aMPPCIUSter产品总共包含三大核心组件,分布式管理集群GCWare,分布式调度集群GCluster和分布式存储集群GNodeo它们的

20、功能分别为:GCluster:GCluster负责SQL的解析、SQL优化、分布式执行计划生成、执行调度。GCWare:GCWare用于各节点GCluster实例间共享信息(包括集群结构,节点状态,节点资源状态等信息),以及控制多副本数据操作时,提供可操作节点,控制各节点数据一致性状态。GNode:GNode是GBase8aMPPCluster中最基本的存储和计算单元。GNode是由GCWare管理的一个8a实例,每个数据节点上有一个GNode实例运行。GNode负责集群数据在节点上的实际存储,并从GCluster接收和执行经分解的SQL执行计划,执行结果返回给GClustero数据加载时,G

21、Node直接从集群加载服务接收数据,写入本地存储空间。除了以上核心组件外,还有GCMonit组件,用于定期监测GBase8aMPPCluster服务程序的运行状态,一旦发现某个服务程序的进程状态发生变化,就会根据配置文件中的内容来执行相应的服务启停脚本命令,从而保证服务程序健康运行。4.L422达梦MPP达梦大规模并行处理集群组件(DMMassivelyParalIelingProcessingClusterComponent,缩写DMMPP)是基于达梦数据库管理系统研发的完全对等无共享式的并行集群组件,支持将多个DM7节点组织为一个并行计算网络,对外提供统一的数据库服务。客户端可连接任意一个

22、EP站点进行操作,所有EP对客户来说都是对等的。图中互为镜像的节点是配置了守护进程的主备机,在主机发生故障时守护进程会自动将镜像备机切换为主机,继续提供对外服务,大大提高了系统的可用性和可靠性。MPP系统内每个站点只负责自身部分数据的读写,执行计划是完全并行执行,完全无I/O冲突,充分利用硬件资源,只是额外增加了数据在节点间移动的通信时间,在高速局域网内,通信时间大大缩短,更能体现大规模并行处理的优势,随着系统规模的扩大,并行支路越多,优势越明显。4.2建设内容4.2.1数据模型管理4.2.Ll元数据管理元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或结构(长度、字段、数据列),

23、或其相关数据(位于何处、如何联系、拥有者)。元数据管理通过将分散、存储结构差异大的资源信息进行描述、定位、检索、评估、分析,实现了信息的结构化,为机器处理创造了可能,从而大大降低数据管理人工成本。对贴源层、中间层、应用层元数据、数据字典全方位管理,对各层各系统分别进行元数据接入管理,形成数据资产目录,实现数据使用可追溯,数据责任有落实。自动探索平台系统中存在的表信息,记录表名、字段等信息,同时支持数据预览。4.2.1.2血缘关系根据任务、脚本等因素自动建立血缘关系,实现数据链路的可查询、可跟踪。通过血缘关系分析可以实现关键信息的追踪、记录和影响分析,帮助了解分析对象的下游数据信息,快速掌握元数

24、据变更可能造成的影响,有效评估变化该元数据带来的风险。还有一个重要的作用是溯源,分析数据流向,具体到字段级的数据解析,获取数据上下游、对象关联对象等等关系,快速定位问题字段,降低数据问题的定位难度。面ta关浜阳4.2.L3元数据自动变更对于平台系统中的表、字段等信息发生变化时,无需人员手动修改,提供自动扫描并变更功能,同时对这些元数据进行版本管理,可快速查询到变更信息。元数据异动自动变更功能提供了配置定期任务去更新各个源系统中发生变化了的元数据到元数据数据库中,不需要手工去更新修改了的元数据表结构,减少维护人员工作量,同时提供元数据版本管理功能,通过版本来管理不同版本的元数据表字段,不对现有的

25、元数据产生影响。4.2.2数据资产管理遵循“盘”、“规”、“治”、“用”的总体思路,坚持“统一管理、夯实基础、服务应用、持续完善”的工作原则,通过构建统一数据资产管理平台,规范日常数据资产管理制度,建立完整的数据资产管理体系,支撑公司挖掘数据资产价值。4.2.2.1数据资产目录支持多级表类目管理,实现最快时间找到最需要的数据。实现对数据资产盘点成果中所涉及的源端系统、共享层数据目录的统计查询功能。包含按业务系统和模型两种方式展示,其中业务系统按一级、二级、三级业务分类展示;模型按不同的主题域分展示。主题域根据SGYlM规范,分为用户域、财务域、物资域、资产域、电网域、项目域、客户域、安全域、市

26、场域、综合域展示数据资产。目录均可穿透到数据表级别,展示系统表的详细信息,如中英文表名、表类型、负责部门、负责人等。4.2.2.2模型溯源分析对源端系统到贴源层、近源层、共享层的数据血缘关系提供可视化分层展示,支持表级、字段级溯源分析及展示。4.2.2.3系统数据接口实现对数据资产盘点成果中源端业务系统接口信息的可视化全景展示,支持穿透查看具体接口方式、接口描述等信息。4.2.2.4数据负面清单通过按业务系统、按部门对负面清单数据进行数据表及数据字段的维护,建立数据负面清单,对贴源层/近源层数据的相关数据表或字段纳入负面清单管控,数据共享服务涉及的模型表,根据血缘关系追溯,对已纳入负面清单管控

27、的数据须业务部门审批同意,同时对数据进行脱敏处理。电网全!R数据数据中台数据服务共享4. 2.3数据质量管理基于数据资源目录,按照“谁产生、谁负责”、“谁校核、谁负责”的原则,制定数据责任清单,明确数据的责任归属,落实数据质量责任。娄照质量分析4.2. 3.1规则库管理规则库管理提供丰富的质量校验规则,包括通用的非空、唯一性、邮箱、URL地址、数据类型、数据范围等校验规则,而且还支持自定义规则,可根据业务需要扩展个性化的校验规则,满足各种业务质量校验要求。根据业务的规则标准配置对应的数据校验规则,并将这些规则进行固化处理,简化规则配置操作。4.2.3.2规则配置从数据的完整性、唯一性、合理性三

28、个质量维度对元数据进行规则配置,规则配置管理具备选择表及表字段进行规则配置功能,基于丰富的校验规则库,可以使用规则库配置规则,也可自定义校验规则。4.2.3.3规则执行规则执行具备与任务调度模块相结合,提供立即执行和定时执行数据校验,及时发现不符合校验规则的数据,同时可以根据任务执行日志监控,掌握所有执行器执行情况。4.2.3.4质量报告具备展示校验报告功能,校验不符合规则数据汇总统计,能以清晰表格方式显示每类规则问题数、异常占比等情况。提供按照完整性、唯一性、合理性三个质量维度展示校验不符合规则数据清单功能,支持报告清单导出功能。4.2.4数据服务开发提供可视化配置restfulAPI、E文

29、件、KAFKA等方式获取数据,无需代码编写,帮助用户简单、快速、低成本、低风险地实现前后端分离的服务。提供数据服务目录、数据服务配置、服务发布、服务访问权限管理,帮助客户实现数据服务规范化和标准化。4.2.4.1数据服务监控数据服务监控具备数据服务和应用调用数据服务API调用次数统计、调用时长统计功能,及时监控服务api调用的整体情况。RESIFUlJReE文件则服务统计政w iWfl O在蝴氏眼符占HJS KAFKAS务 RESTFUUg务E文仲期服符发布情况法棣 己发棣86务际用情况发花息数:29米发花息敷:75matfi名次主91名好4.2.4.2数据服务目录管理提供对外服务目录的新增、

30、编辑、删除等维护功能。=贝3SE与盛务目录管W5:和人日K2*nehow2028-06165154BS02*SaS202041709514282f令KeSS202008-17165130:一济日袅KS日WIelhow20208-1163951SSSS好N目量IelhOW202(M8-181641M限目最FMMtnow2O2(M18-18164223和g*乌日会Ielhow202O8-261028284.2.4.3数据服务配置数据服务提供基于Web页面配置可完成服务的开发、测试、发布等管理宫内容,帮助用户简单、快速、低成本、低风险地实现微服务聚合、前后端分离、系统集成工作。4.2.4.3.1Re

31、stfulapi月艮务提供了通过可视化配置生成RESTFULAPI,供调用者访问数据,无需编码,支持向导模式和SQL模式生成API。配支等数法修致密源数据源名称运行数据交换平台数况表名称TH DEP.DM USERQ-基本信息请求参数釜数名称邳定字段参数笑里操作用是古必国默Wa痛还USERNAME 8/40USERNAMEStrina0/100miaoshu 87100谕回叁数爹数名称注定字段爹故类型砒还PASSWORD8/40PASSWORDStrinqUSERNAME8/40USERNAMEStrinq疾作0/1000/100搏序整数踊还整数名称USERNAME8/40DESC0/100分

32、页参数爹数名称竭字段后还DaaeSize8/40PageSize每贝记录条数Paqelndex9/40pageindextotalCount10/40IolaICountKAFKAK#、Ei? YN20 DH8WJ202(H)M2 14 42020816 18 2 KAFKAS先 2020814 162S42O 地涧口 地洞= 页 KyB - KK84.2.4.3.2KAFKA月艮务提供了 kettleweb可视化配置将数据发送到KAFKA,供调用者在KAFKA中获取数据消费。口服务目录-0小明目录口项目名合并口搜狗口广东地沟asdsad测试目录Citest0t|ya:口网络发令口测试目录ao

33、2CJssss口服务目录U-I也,42433E文件服务提供了kettleweb可视化配置将数据转化为E文件,存放在HDFS中,供调用者下载E文件。 贝敦密龈务故况服务诩E文件服务KAFKAH口服务目录 口小明目录D项目名合并 0颗口广东地沟U asdsad D测试目录 testCntjyS 口网络发令 0a 目 MUMKo2 Dssss 口服产目录 C3 IIMlWD 8IWX*2333rsaW-JlrsaRiEJKC小明日索4.2.4.4服务市场对已经发布的数据服务进行统一管理,消费者可以在服务市场选择自己需要的数据服务,并提交申请。三tt三8K务所S.曷自量修理 KAFKAegE文停黄服务

34、市场分类:全部清1|yA东丽.网络发金一E全部服务RESTFULKfeKAFKA服务E*件服务检修票信息些路带电作业临时安全措施Xege19 14 4828所。次启用0发布珂网202O)7-221952?02002 14 44 113T布91同 20200716 15M. 10004.2.4.5应用管理对需要访问数据服务的应用,进行了权限控制,应用需要提交访问申请,审核通过后,才能访问数据。提供应用的新增、编辑、删除、启用和禁用、配置数据服务权限、查看已经配置的数据服务等维护功能。瓦田才告理*ewa簸务自显告违三dM4.2.4.6申请管理提供数据服务申请后,查看申请流程情况,包括审核中和已审核

35、两个tabO三5员教第做名中酒便建诩fi入隘冬称QnO330更名片FfiibMfimxv电印9用名称电谪人MW一件ceshsragKAFKAe仍CSffi2Wow202IMa)7160710Et经普南电作W靛第目最RESTFULB#2UAhOW2O2OW7150710Elas4tesKAFKAfiMftstaWlhow202(Ma)7160710H送京便电际日家RSTFUL三Mlhw20200907160711*F全愤禽RESTNL再试S用2Mlhcw2O2Og筋在135MihrwXWMO-U1*n*74.2.4.7审核管理提供数据服务审批功能。三msIwa服光灾电*H理三tr三修努目最IT技

36、I怠卸TM楮11ttll689KA用号完卷份MiebHgKftXfi串遣由用X#KWtt1cesissrsjKAFKA如喷角2WihowM(M)M71607102R务日录在SraiS务wafi2IMbow2C2OOM71607103SftSKAFKAfiMMhoWNXHg7163104务白案RESTFUL三Ielhow202g0716:07115E安全撞诲鬣务日录R三SFULIolhow2020071607116麓修目疑RESTFUL三WOMS1WlhOW2020)091119157IesSest*0醛SYFULjR务testIdhow202(8111412058M三ka*aMHAiS*KAF

37、KAM窗试应用leow202(M-141553g及17条1OS/35121页4.2.5非结构化数据提供了 WORD、PPT等办公文档、文本、图片、各类报表、图像和音频/视频 美 3KWtB 文件 BHea原号日量名骈1 平台技术8523 xh4 *5 BUMt6 W7 9月份各团队懵分考皿晶娟时共40条10/页信息等等非结构化数据的存储和权限控制功能。提供对非结构化内容进行智能搜索功能。4. 2.5.1文件目录管理提供文件目录管理功能,并给相关目录赋权限,各部门人员只能看到自己部门目录下文件。眄公司N台技术郃E件批量上传有IWDxhh口9月份各疣C1*5LtfK目录119m口三倏CM2SLom

38、bo口.MRCfMaI口自雌4.2.5.2文件批量上传提供初始化批量导入文件,该操作不需要审核,直接导入。4.2.5.3文件管理42531申请管理提供给部门专责人员上传文件,并提供提交审核功能。42532审核管理提供给审核人员来审核专责上传的文件。=5页弛化器僵女mra员能肱亮科没 SttWJ 信南批BWtt文日量文件包Sm 山SPog广东中白35化都9月皿捧ZXbX FMX孝冬2文同gt情。mh安全H 所曾拄干公%9octe16007W2ti)jw共享白量本FA文春IULt伸&杼TR宁?02Q-iai2 09 38242020-1M3 15 02020-10-12 09 5914202tM9

39、)3 11 595共条1O*3542533审批流程设置提供设置文件审核所需审核节点数量,并对各审核节点配置审核人员O=5.员二缩构化效据文件管理才Tt二裂*tttttatffiWia向fH除4.2.5.4文件查询提供给有该目录权限的人,查看和下载该目录下的文件功能。三为三aww三文件杳询C Bae内部文件共享文仲目录路径:i营销部 会议纪要 UITK. *文件名XWISgtesin京豪云下融员工行为Me卷RS氏操作搭蠢V5 3docx*5白 0 子讲 WebSPipdf蚁记饕闰IS苫理磨改时向20201Q19 0928 564 00MB2020-10-14 1642:223 17MB202CM

40、)27 17 29 24aer tfxss)sctwr, 会KS共19枭10/页4.2.5.5数据统计提供了文件总数、文件总下载次数、今日上传文件数、今日下载次数的系统统计信息。同时提供了可以选择某个单位下各个部门目录下文件的下载次数柱形图,同时展示文件下载排行榜,查看哪些文件是大家比较关注的。文件系统概况4.2.5.6智能搜索智能搜索通过建立统一的搜索词库,能快速、准确的检索出相关文件,同时支持热门搜索排名和相关搜索功能。三*页aErettJ8tKKJKR53awwe舞ssa文悻m*s口出日有MWiT智能搜索点击搜索后,展示出文件搜索结果。W1网9M4.2.5.7词库管理词库主要用来实现精准

41、的中文分词,为后续语法分析及语义分析提供坚实的基础,假如无法对搜索语句进行正确的中文分词,则后续的语法分析、语义分析的结果肯定是不正确的。为了实现精准的中文分词,提供专业词库+通用词库的词库。专业词库用来提高调度领域专业词汇的识别率,而通用词库则用来提高词库的覆盖率,以达到提高搜索语句分词准确率的目标。还提供词库的新增、编辑和删除,更新索引数据,同步文件等功能。85413共854123假103V4.2.5.8标签定义提供标签目录的新增、编辑和删除功能,及定义标签的功能。W页dt三mSa数页BJMfiejS任备8章文件目IHe自步日立阻UW玻w旭Wf,口息经理口制i超理D市场部自理公注事务部经理口幽的移理4号1刖S名谆分类宿逐后修改第日财务郃一理财务三2O2OO92517:1255EJit三32外贸图SiS外贸部202009-2709:27:322IRttMtl3行收入g忌笠及行政人-2020-0301120062二Ii4WWi3KO25客户版男都客户酶R23*1Oft35123飞往1页2020-10-1210:17242020-09-11102726

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号