30 某系统集成公司ITIL信息技术服务管理体系运行管理办法—安全运行控制中心分册
某系统集成公司ITIL信息技术服务管理体系运行管理办法—安全运行控制中心分册
1安全运行控制中心工作目标和职责
1.1目标
安全运行控制中心的管理目标是:提高系统运维管理的水平,实现中国电子口岸系统的突发事件发现、处理、协调、跟踪、上报、等关键环节的控制管理,保证业务持续稳定运行,实现系统安全运行99.99%。
1.2职能
安全控制中心是公司对内、外运行服务支持的唯一接口,承担着系统突发事件处理和业务处理的技术支持服务及由此产生的内部协调工作,并为问题管理、变更管理、配置管理、发布管理等其它相关工作提供联系纽带。主要职能如下:
- 接受、记录、分级和跟踪客户服务请求;
- 提供二线的技术支持服务;
- 将二线不能解决的问题提交到三线,并协调三线支持小组为客户提供服务;
- 及时通知客户其请求的当前状态和最新进展,使客户能够及时了解服务的进展情况;
- 根据服务级别协议的要求,监督规章制度的执行情况并在必要时对其进行修正。
- 在客户确认突发事件已经解决后,结束突发事件处理过程,并关闭。
- 提供系统的运行状况报告。
2安全运行控制中心架构
安全运行控制中心是运行管理所而设立的虚拟机构,它由值班经理和技术支持人员组成。安全运行控制中心与热线支持服务、系统监控人员、机房巡检人员以及其他客户有直接接口。热线、监控和巡检过程中反映的突发事件随时提交到安全运行控制中心。
安全运行控制中心是运行服务管理的核心。安全运行控制中心与突发事件管理流程联系最为紧密。安全运行控制中心负责跟踪记录各种事故,并负责协调三线支持小组处理和解决突发事件,处理二线支持无法解决的突发事件。同时,安全运行控制中心是问题管理、变更管理、配置管理、发布管理和服务基本管理等流程进行协作的纽带。
2.1组织地位
安全运行控制中心组织地位图
安全运行控制中心是运行服务管理的核心,控制各项流程并管理基础数据库。
2.2角色职责
安全控制中心的组织结构图如下图所示:
安全控制中心的组织结构图
安全控制中心的人员组成如下:
2.2.1控制中心值班经理
设控制中心值班经理1人,由公司各部门选派人员轮流担任。值班经理在上岗前,需要进行专门的培训,合格后才能够上岗。值班经理具有值班当日的故障处理最高人员调度权。
值班经理的职责包括:
- 接受监控和热线等突发事件的汇报,根据突发事件响应级别进行上报;
- 派发突发事件的处理工作任务,并在现场组织调度;
- 对突发事件的处理过程进行上报;
- 对未找到根本原因或者无法根本解决突发事件,升级为问题;
- 将突发事件处理结果反馈给热线和监控。
- 突发事件处理结束后,完整的记录突发事件,于下一个工作日报送到运行管理部;
- 对一级和二级故障,值班经理要组织各参与故障处理人员编写“故障处理分析报告”,其中要明确故障处理的各个时间点的工作内容、处理方案、处理过程、上报过程和处理结果。然后报送到运行管理部。
2.2.2技术支持组
作为二线技术支持人员,技术支持组由网络支持人员、系统支持人员、数据库支持人员、中间件、应用支持人员组成,由运行服务部和系统部署部两个部门指派,轮流进行值班。技术支持组进行日常的系统检查,进行系统的趋势分析,发现系统潜在的问题,并及时进行处理。同时技术支持组接受值班经理指派的突发事件处理任务,第一时间响应突发事件,进行突发事件处理,如果需要三线技术支持,技术支持组要协助其共同处理突发事件,最后将突发事件处理过程和状态及时上报到值班经理。
2.2.3相关人员
安全运行控制中心相关的组织包括热线、机房巡检、系统监控三类一线支持人员和三线技术支持人员,它们在突发事件处理的过程中共同协作。
2.2.3.1热线
热线服务人员由增值服务公司人员担任,将用户提出的服务请求经过过滤处理,把无法处理的请求提交到安全运行管理中心,寻求技术支持。
2.2.3.2机房巡检
机房巡检人员由增值服务公司人员组成,对网络、系统、应用资产等的运行状态和周边环境进行检查、记录、分析,达到发现问题或问题隐患的目的,对于状态异常的资产情况及时通报安全运行控制中心值班经理。
2.2.3.3系统监控
系统监控人员由增值服务公司人员组成,对信息系统相关的网络、系统、应用的运行状态进行实时的监控,发现系统的异常情况及时通报安全运行控制中心值班经理。
2.3工作场所
中国电子口岸数据中心 “安全运行控制中心”,目前设置在金宝街办公区9层906室。
2.4工作环境
安全运行控制中心的设备包括:
值班经理:
- 电话:1部支持电话(功能:市话、专网、长途)
1部手机(专门用于值班经理非工作时间的电话职守,保证有统一的联系电话)
- 传真、打印一体机:1台(功能:市话、专网、长话)
- 专网pc机 1台(监控、维护、协同工作)
- 外网pc 机 1台(收发邮件、查阅资料、验证浏览器运行情况)
- 内网的测试PC用机终端:1台
- 电话会议号码:010-58511989 4008100800 8009900800(相应的操作手册)
- 安全运行服务平台软件(待开发,先按照手工流程运作)
二线技术支持:
- 工作电话: 5部(功能:市话、专网。网络、数据库、系统、中间件、应用支持)
- 专网pc机 5台(监控、维护、协同工作)
- 外网监控机 1台(网络专用)
- 业务操作IC卡:3张(运行网、测试网、培训网的测试卡各1张,用于突发事件的监测,应用技术支持人员准备)
- SSO操作IC卡:每人1张(自备)
2.5时间安排
考虑现阶段的工作实际情况,安全运行控制中心的工作时间安排为:工作日于9:00----18:00进行现场工作。休息日或节假日工作时间也为9:00----18:00。在18:00----次日9:00的时间段内可采用电话职守方式值班,由运行管理部将值班经理和技术支持组统一编班,每班设值班经理1人和技术支持组系统、网络、数据库、中间件和应用各1人。监控、巡检、热线人员7*24小时现场值班。
随着工作的完善和业务的要求,可考虑适当延长现场值班时间,将现场值班延长到12小时,分成8:00~17:00和17:00~20:00两部分。
如果有了运行工作园区,可以进一步考虑7*24小时现场值班,设置4班。每日6:00~14:00、14:00~22:00和22:00~次日6:00三班循环。
每一班安全运行控制中心值班人员在下班时,要做好工作交接。具体办法见《安全运行控制中心值班管理制度》。
安全运行控制中心平面图
3安全运行控制中心的管理
安全运行控制中心由运行管理部统一管理。运行管理部负责组织安全运行控制中心的值班,负责安全运行中心值班经理的培养,提高值班经理的突发事件组织、协调、指挥能力,检查、监督安全运行控制中心工作运行情况。
安全运行控制中心作为运行服务管理的接口,管理报告包括运行服务情况的整体指标,具体报告形式和频率如下:
日报告:每天评估每个事故和问题对服务级别的影响,所有的突发事件,要求升级的服务,未满足协议要求的服务,所有未解决的事故和系统日运行情况。此报告由安全运行控制中心值班经理当日提交运行管理部。
安全运行控制中心需要将值班工作时间内的系统日常维护情况、更新情况和突发事件情况等进行汇报,添写《安全运行控制中心工作汇总表》。在下一个工作日,控制中心值班经理需要将《安全运行控制中心工作汇总表》提交到运行管理部。表格具体内容见附件1。
当由突发事件出现时,安全运行控制中心还需要填写《突发事件登记单》(祥见《突发事件管理分册》)。
周报告:服务可用性;主要的事故区(发生最频繁的、耗时最长、升级为问题);此报告由运行管理部根据日报告汇总统计上报。
月报告:服务可用性;总体的绩效、成果和趋势分析;服务提供的成本等。此报告由运行管理部根据日报告汇总统计上报。
重大故障专项报告:在处理完一级和二级故障后,值班经理要提交的“故障处理分析报告”。运行管理部要审批值班经理的报告,然后向有关领导汇报并备案。
4相关文档
- 附件1《安全运行控制中心工作汇总表》
- 运行管理办法----突发事件管理分册
- 运行管理办法----问题管理分册
- 运行管理办法----变更管理分册
- 运行管理办法----配置管理分册
- 运行管理办法----发布管理分册
- 《安全运行控制中心值班管理制度》
安全运行控制中心工作意见反馈表
值班经理 | 支持人员 | ||||
值班日期 | 填表日期 | ||||
工作中的问题: | |||||
改进意见: |