23 某省移动网管中心IT集中运维咨询项目ITIL事件管理访谈纪要
访谈目的
在本次事件管理流程评估分析的过程中,HP咨询顾问针对流程规范、人员角色、绩效管理、持续改进、流程集成和支持资源方面信息,与IT维护室运维专家进行详细的访谈和了解,找出相关问题和期望,为流程设计提供依据。
编号 | 访谈问题 |
1.管理规范 | 有单一的事件管理流程,覆盖生产服务和基础架构支持的所有事件? 有通过IMEP支持的事件管理流程,事件工单来自监控系统自动生成、巡检发现手工录入和业务反馈三个方面。 期望能够建成部门内使用系统,希望把所有内容都融合到事件管理系统中,将有利于对事件的管理和改进。 需要将现有事件管理流程进行完善,使其更加规范,利于执行,实现标准化和专业化。 有正式定义的事件管理策略,并定期回顾(目标、范围)? 有事件的分类分级管理办法,但是更多在业务层面,大多对于IT管理无法关联。根据业务系统的重要级别和事件影响程度决定事件的级别,有对应的解决时间要求,但是没有进行制度约束,同时,在每月考核过程中会对一些指标进行讨论。 期望在系统中,固化一些有价值的指标和统计报表,用于对工作量、处理效率等情况的分析和考核。 需要梳理事件管理策略和指标,重新讨论和定义事件管理的目标和范围。 事件管理流程描述了流程接口和与其他流程的关系,以及配备了详细流程或工作指导? 有另外的系统支持,包含事件、问题、变更管理,以及相关的流程接口。 希望将这些流程关联做到IMEP中。 需要建立符合标准的事件管理流程的同时,建立与变更和问题管理的标准关联关系。 有重大事件处理流程,该流程能够协调和调动必要的资源,如为重大事件的处理提供工作场所方便解决事件? 有重大事件处理方案,按用户影响范围分级,通报流程不一样。不同业务系统按不同级别定义。一边通报,一边处理,并请示上级,有相对的预案。 希望提出关于重大事件和应急处理的解决方案。 需要在事件管理流程中,建立专门针对重大事件的专用流程。 事件被恰当的分级、区分类型和分类? 类型按照功能组进行分类,事件也会按照业务系统和影响程度进行分级。 事件的定级策略比较主观,希望与CMDB中设备的级别有一定的关联关系。 需要梳理事件信息,讨论并定义标准的事件分类分级方法。 定义了事件升级方法并得到了遵从? 无事件升级策略。需要在管理流程中定义事件升级制度。 |
2.人员/角色 | 有专人负责事件管理流程,并对整体流程负责(授权定义、管理、改进)? 定期和不定期的回顾。由告警汇聚的人来承担这个角色,负责事件处理过程的管理。对超时有考核。需要定义事件管理流程的相关管理角色,包括事件管理流程经理、一线、二线、三线支持人员。 流程涉及的所有人员均被明确定义了角色和职责并被司职者深刻理解? 没有明确的制度定义。需要在原有基础上,量化角色和职责,并进行相应的培训。 具备合适的支持人员或外部服务提供商参与解决事件? 目前没有专人进行管理和支持。希望在事件管理中将供应商和事件管理人信息加进去,再进行每月汇总,并对供应商进行考核。需要设立合适的专职业务接口人角色,来协调事件的解决过程。可以考虑轮流担当。
|
3.工具相关 | 有合适的事件记录和管理工具? 现在使用IMEP\EXCEL来记录和管理事件信息。需要通过升级或新建合适的工具平台,实现事件的记录和管理。 事件记录包含足够准确的信息,以便事件的管理、报告、根本原因分析和趋势分析? 有事件描述信息;在申请闭环时,需要填处理情况内容;有告警分析内容,并辅助进行改进。需要完善事件信息字段,包括必填项和选填项的增加和修改。
|
4.持续改进 | 有分析事件流程的管理结果用于识别差距和改进点,并采取相应的改进措施? 有部门内部使用工具可以将事件管理与问题管理和变更管理进行集成。需要在事件管理流程中,定义标准且适用的流程关联制度。
|
5.绩效报告 | 有定期分析、回顾事件管理流程数据,并生成报告,与定义好的KPI比较,识别趋势和不一致性? 没有对工具和流程的回顾,有对IMEP的跟踪改进,定期的review和改进。 需要在事件流程中,定义流程的回顾过程,定期生成报告。 有提供例行报告可用于事件管理服务水平的评估? 每月有关于事件管理的例行报告,没有标准化。需要定义标准的管理报告模板。
|
6.监控告警 | 监控告警概况 集团大网的监控按照业务分类,分为话音网、数据网等。省内监控按照专业分为九类:交换、数据、无线、动力、增值业务等。数据类和部分增值业务类的告警会涵盖到IT维护室范畴。告警首先由agent产生,发送到告警平台,进行整理和过滤,然后发送到亿阳告警管理系统,由系统对告警进行过滤、合并、格式化操作,再由监控人员对告警进行手工导入IMEP形成工单或者由系统在等待一定时间后,自动导入到IMEP形成工单。监控人员的操作属于T1级处理。 监控告警与事件管理的关系 设备入网时,执行告警标准化流程,才可以对该设备产生的告警进行标准化。每一条告警经过标准化后,由监控人员手工或系统自动生成工单,发送至IMEP。告警最初由代理发出,经过监控管理系统,亿阳告警平台,再进入IMEP,会产生一定的延时。工单采用谁发起谁结束的原则,负责整个工单的转派、驳回等工作。有效的考核指标包括:填写正确率、处理及时率、覆盖率等。 |