时空信息云平台—运维规范.doc

上传人:小飞机 文档编号:4134597 上传时间:2023-04-06 格式:DOC 页数:18 大小:261KB
返回 下载 相关 举报
时空信息云平台—运维规范.doc_第1页
第1页 / 共18页
时空信息云平台—运维规范.doc_第2页
第2页 / 共18页
时空信息云平台—运维规范.doc_第3页
第3页 / 共18页
时空信息云平台—运维规范.doc_第4页
第4页 / 共18页
时空信息云平台—运维规范.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《时空信息云平台—运维规范.doc》由会员分享,可在线阅读,更多相关《时空信息云平台—运维规范.doc(18页珍藏版)》请在三一办公上搜索。

1、时空信息云平台运维规范目 录1.范围42.规范性引用文件43.术语及定义43.1数据运维43.2云平台53.3资源池54.运维管理体系55数据运维55.1矢量数据65.1.1要素跟新65.1.2范围更新65.1.3版本更新75.2影像数据85.3文档/表格数据95.4三维数据95.5流数据95.6元数据106资源池运维106.1服务实施对象和活动106.2例行操作106.2.1监控106.2.2预防性检查106.2.3常规作业106.3响应支持116.3.1事件驱动响应116.3.2服务请求响应116.4优化改善116.4.1适应性改善116.4.2增强性改善116.4.3预防性改善126.4

2、.4咨询评估127机房基础设施127.1运行维护127.1.1日常操作及监控分析127.1.2数据与介质管理137.1.3机房管理137.1.4网络管理137.1.5弱电管理147.1.6服务器及系统变更147.1.7配置管理157.1.8事件与问题管理157.2应急管理157.2.1应急准备157.2.2应急处置168运维服务报告168.1常规报告168.2事件报告178.3专题报告171. 范围本规范阐述了智慧城市时空信息云平台的范围、用户、对象及体系架构。规定了时空新云平台规范性引用文件、术语和定义、配置管理、事件管理、变更管理、安全管理等,以及相应附录。本标准适用于智慧时空信息云平台的

3、运维管理,为时空信息云平台的运维提供依据。2. 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件,凡是不注日期的文件,其最新版本(包括所有的修改单)适用于本文件。 基础地理信息标准数据基本规定(GB 211392007) 基础地理信息要素分类与代码(GB/T 13923-2006) 国家基本比例尺地形图更新规范(GB/T 14268-2008) 三维地理信息模型数据产品规范(CH/T 9015-2012) 三维地理信息模型生产规范(CH/T 9016-2012) 智慧城市时空基础设施-基本规定(征求意见稿) 信息技术安全技术信息安全管理体系要

4、求(GB/T22080) 信息技术安全技术信息安全管理使用规则(GB/T22081) 信息技术软件维护规范(GB/T20157-2006)3. 术语及定义3.1数据运维智慧时空信息体系数据运维方式主要包括基础数据版本动态更新和时空大数据数据实时更新两类。整个时空大数据的动态更新将在制定统一规范的动态更新标准和机制的前提下,从数据采集、处理入库、服务发布等全流程保障数据实时化动态更新。3.2云平台云平台指市时空信息云平台3.3资源池资源池是一组物理资源或一组虚拟资源的集合,可以从池中获取资源,也可将资源回收到池中。资源包括物理机、虚拟机、虚拟网络设备、物理网络设备和IP地址等。4. 运维管理体系

5、时空信息云平台运维管理由运维活动角色、运维管理组织结构、运维服务支撑系统、运维管理对象、运维管理流程和IT运维服务等组成。运维活动角色由,运维服务商、运维管理部门、运维部门组成运维服务包括安全管理、监控管理运维管理对象包括运维部门和人员、IT服务商、IT用户、IT应用系统、IT基础设施。运维服务:数据运维服务、资源池运维服务、基础设施运维服务 5数据运维为保证所有数据都能够追本索源,在导入变化数据对历史数据进行更新时,所有数据都需要创建历史基态版本,并添加时间基准。创建历史基本版本的方法:将现势库变化的数据拷贝一份形成是历史数据,将现势库的变化数据变成历史数据,重新创建一个空的当前基态变化数据

6、。5.1矢量数据5.1.1要素跟新矢量数据要素更新适用于要素级的更新,可记录数据的变化情况。矢量要素变化流程图如下:5.1.2范围更新矢量数据范围更新适用于比较大范围的矢量数据更新,并对该范围内的所有要素全部进行更新。具体更新的流程如下:5.1.3版本更新矢量数据版本更新适用于整个市范围内的矢量数据进行更新,可以将历史数据保存成一个版本,新版本的数据可作为新一版的数据导入到系统中,具体流程图如下:5.2影像数据市各地区每年会对区域内进行地表数据进行拍摄,而数据的更新相对矢量数据来说将变得更加简单,每更新一次都是对历史数据进行备份,对新的数据进行入库。同样的,对于影像数据需要根据图幅编号进行接边

7、处理。具体的更新流程如下:5.3文档/表格数据文档/表格数据采用追加的方式进行更新,不删除原有数据,直接累加入库,形成时间序列的数据。5.4三维数据三维数据更新与影像数据更新一致,保存为不同版本的三维数据。5.5流数据流数据包括视频数据、音频的数据,多为从传感器接入的数据。采用追加的方式进行更新,不删除原有数据,直接累加入库,形成时间序列的数据。5.6元数据元数据更新是由其他数据更新导致的。在数据更新时,提供手动录入基本信息(区域、生产日期、密级、比例尺、描述、提供单位)的功能,同时自动获取导入的系统时间。6资源池运维6.1服务实施对象和活动对象为分布式的虚拟计算端资源(虚拟机、虚拟计算资源池

8、)集群,充分利用集群汇聚的强大威力,对海量数据做分布式的处理,快速的完成数据分析工作。集群的维护特点是集中管理,集中控制,集中运维,有效监控,提前预警感知,为计算系统的正常而有序的运行提供坚实的基础。6.2例行操作6.2.1监控虚拟计算资源监控主要监控虚拟计算资源的运行状况变化趋势及其指标。6.2.2预防性检查对于虚拟计算资源预防性的检查,包括:虚拟计算资源故障的提前预警,系统运行趋势的分析。安全日志的分析等。6.2.3常规作业对虚拟计算资源的常规作业参见表,包括但不限于:更换损坏的硬件、虚拟机监控器软件升级、日常的可靠性计划制定、制作虚拟机快照、虚拟机手工迁移、虚拟机资源配置更改、虚拟机备份

9、克隆与恢复、虚拟机维护(创建、启动、停止、删除、回收等操作)、虚拟资源池的扩容与资源再分配、制作与升级标准虚拟机模板、虚拟机映像维护、虚拟机转换、虚拟资源的访问控制与权限管理、制作系统运行状况报告。6.3响应支持6.3.1事件驱动响应针对虚拟计算资源所依赖的硬件,网络及软件故障而进行的响应,包括但不限于解决物理服务器故障、解决物理网络设备故障、解决虚拟机监控器软件故障或者缺陷、虚拟机紧急迁移、虚拟资源池紧急扩容。6.3.2服务请求响应 根据应用系统运行需要或需方、服务相关的请求,而进行的响应服务,包括但不限于:数据备份与恢复、虚拟机备份与恢复、系统扩容、虚拟机供应、虚拟机迁移回收变更、虚拟资源

10、池变更。6.4优化改善6.4.1适应性改善根据应用系统的要求,进行改善虚拟机计算资源cpu、内润容量、硬盘容量、网络的调整虚拟计算资源迁移。6.4.2增强性改善根据应用的特点和发展要求,以及数据量处理能力要求进行升级,扩容等物理服务器计算能力扩容,物理服务器内存扩容、物理服务器网络吞吐能力扩容虚拟计算资源高可用性增强、虚拟计算资源容错机制增强、虚拟计算资源备份6.4.3预防性改善 根据对虚拟计算资源的运行记录和趋势的分析发现潜在的隐患而进行的改进作业,包括但不限于:根据系统监控得到的信息替换可能存在问题的内存,CPU,硬盘,网络设备等、根据系统的压力增长趋势主动对物理服务器的数量进行必要的扩容

11、、根据系统的发展趋势对网络系统采取必要的扩容。6.4.4咨询评估 通过对虚拟计算资源的运行记录、运行趋势进行分析,根据应用系统的特点和运行需求,提出物理计算设备、虚拟机监控器、虚拟计算资源池、虚拟机的改进建议和方案。7机房基础设施7.1运行维护7.1.1日常操作及监控分析 未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。 运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。 主要监控指标具体如下: a)

12、 机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等; b) 网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络延时、丢包率等; c) 主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等; d) 存储:设备运行状态、数据交换延时、存储电池状态等; e) 安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等; 7.1.2数据与介质管理 配合数据部门,对核心业务数据进行周备份,并每季度进行恢复性测试。 对设备和人员出入进行管理,进入机房应限制和监控其活动范围,并

13、有专人陪同;未经批准不得接入生产环境。7.1.3机房管理 对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。 应指定机房管理负责人。 确保机房环境整洁和安全,包括: a) 应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性; b) 应保持机房环境卫生,设备摆放合理,归类; c) 不得随意出入机房。 d) 未经审批不得接入其它用电设备。 7.1.4网络管理 确保网络、系统的正常运行。 网络管理应包括: a) 应保持网络设备的可用性,及时维修、更换故障设备; b) 应负责网络系统的参数配置、调优; c) 应定期对系统容量进行检查和评

14、估; d) 应定期检查网络设备的用户、口令及权限设置的正确性; e) 应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; f) 应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计算机网络跳线应整齐干净,跳线标识清晰; g) 应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。 7.1.5弱电管理 对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。7.1.6服务器及系统变更不得在服务器上使用带有病毒和木马的

15、软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。 使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒 及木马的实时监测,及时升级病毒库。 管理员对管理员账户与口令严格保密、重要数据库,网站,APP等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。 任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注

16、意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。 严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。 除管理员外,任何人不得随意改动服务器内系统及环境配置。除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。7.1.7配置管理 明确配置管理负责人。 建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。 定期对配置进行备份及文档库归类。 及时检查并定期审计,对发现的不一致情况及时纠正修改。 7.1.8事件与问题管理 对运维事件的处理进行规范,对发生的所有事件,根据事件的影

17、响程度和影响范围评估事件处理优先级并及时处理。 对所有事件响应、处理、结束等过程进行跟踪、监督及检查。 对问题进行分析、提出解决方案,通过变更管理审批后部署实施。7.2应急管理 7.2.1应急准备 明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。 应急准备应符合如下要求: a) 系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件; b) 在自身力量不足以满足应急要求的

18、情况下,应与相关供应商签署服务保障协议。协议内容应包括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持; c) 应建立有效的应急通讯联络系统,确保信息畅通; 7.2.2应急处置 在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。 暂时无法确定事件原因、责任和结论的,应先给出事件的初步分析判断,并组织力量尽快查找原因,给出解决方法,采取整改措施。8运维服务报告运维服务实施中,供方应按要求进行服务报告编制、提交。服务报告通常分为常规报告、事件报告

19、和专题报告三类。8.1常规报告常规报告包括的种类:提交分为定时、非定时,其内容包括但不限于:a) 报告名称、报告周期;b) 需方、供方相关信息;c) 服务综述;d) 服务对象(机房基础设施、网络、硬件、软件、数据),包括但不限于:1) 服务内容;2) 服务完成情况及下一步工作计划;3) 服务工作量;4) 相关绩效表现(事件量、问题数、变更实施、故障时间/次数、影响的时间/次数等);5) 安全违规及考核实施情况;6) 服务对象情况分析、隐患及相关的纠正和预防措施(或建议);7) 重大事件(故障)的分析(对需方业务的影响和成本分析)、纠正和预防措施及落实跟踪情况,相关变更和发布的绩效;8) 趋势分

20、析和预警(响应事件量、问题数、故障时间/次数、影响业务的时间/次数);9) 改进/提升建议。e) 满意度分析。8.2事件报告事件报告内容包括但不限于:a) 报告名称;b) 需方、供方相关信息;c) 事件描述;d) 事件发生时间/地点;e) 事件受理时间;f) 恢复时间;g) 事件处理结束时间;h) 事件提出人;i) 事件受理人;j) 事件处理人;k) 事件级别;l) 事件的影响程度、范围;m) 事件处理情况/工作量;n) 事件发生频度;o) 事件原因分析及建议;p) 后续改进计划。8.3专题报告内容包括但不限于:a) 报告名称;b) 需方、供方相关信息;c) 专题存在(或发生/灭失)所需要件(环境或机制) ;d) 专题对象(机房基础设施、网络、硬件、软件、数据),包括但不限于:1) 分析与解决方案建议;2) 对专题对象所造成的变动;3) 时间计划与各时间工作量安排;4) 对其他任何可能相关的服务内容的影响;5) 资源协调与配合;6) 保护或应急措施

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号