10 某网络工程公司ITIL信息技术服务管理体系—事件流程管理办法
某网络工程公司ITIL信息技术服务管理体系—事件流程管理办法
1 概述
1.1 目标
事件管理流程的主要功能是减少或消除存在或可能存在于信息技术服务中的干扰因素给信息技术服务带来的干扰,以确保用户可以尽快恢复自己的正常工作。事件管理流程的目标包括:
在成本允许的范围内尽快恢复IT服务,在给用户和公司正常业务活动带来最小影响的情况下,尽快恢复到SLA中定义的正常服务级别。
- 快速响应服务请求(电话/Web/邮件等);
- 用户在线获得帮助;
- 沟通事件解决的状态;
- 进行事件控制;
- 按规范记录事件;
- 监视、分析和诊断事件,必要时进行事件升级;
- 为其他流程提供合适的信息以改进相关处理流程;
1.2 范围
1.2.1 流程适用范围
本流程适用于XX网络工程有限公司(以下简称“公司”)各相关部门。
1.2.2流程管理范围
事件管理流程涉及财务(资金)管理、营销管理、安全研发管理、协同办公、人力资源管理、物资管理、项目管理和综合管理及其与之相关的网络平台、防火墙、数据库等IT研发环境中产生的常规、非常规事件,以及客户环境中桌面硬件、计算机辅助设备的服务和故障请求,解答用户围绕这些生产环境提出的问题以及咨询。
事件管理流程不涉及尚处于开发或测试中的系统和应用。
2 角色和职责
事件管理流程涉及的角色包括:事件管理流程负责人、事件经理、一线支持、二线支持、服务专员等。事件管理流程负责人和事件经理可以由同一人担任。各角色职责如下:
2.1 事件管理流程负责人
事件管理流程负责人从宏观上对流程运行情况进行监控,确保事件管理流程在各部门间被正确的执行。当流程不能够适应公司实际情况时,流程负责人必须启动分析研究,找到解决方案并进行改进,实现流程的稳定运行和可持续提高。具体职责包括:
- 确定管理流程的衡量指标;
- 确保事件流程能够取得管理层的参与和支持;
- 确保事件流程符合公司实际状况和公司 IT发展战略;
- 总体上管理和监控流程,建立事件流程实施、评估和持续优化机制;
- 确保事件流程实用、有效、正确地执行,当流程不能够适应公司的情况时,必须及时的对此进行分析、找出缺陷、进行改进(假如增加或合并流程的角色),从而实现可持续提高;
- 保持与其他流程负责人的定期沟通。
2.2 事件经理
- 负责对事件的解决协调资源,保证故障的最终排除;
- 当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进支持工程师快速恢复正常服务;
- 确保和问题管理流程经理的有效合作;
- 确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题。
- 负责流程运行质量的监控管理,向公司负责,
2.3 一线支持
- 在指定的响应时间内响应所有服务热线电话、邮件、传真等事件报告;
- 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等;
- 为事件进行适当的分类、为事件分配优先级等属性;
- 将紧急事件分派给合适的二线支持人员;
- 对非紧急事件,首先尝试使用工具、初步诊断、分析相关信息等方式解决问题;
- 如果不能解决这个事件,应当将事件分配给最合适的二线支持小组/人员来处理;
- 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展;
- 与用户确认事件解决方案,关闭事件;
- 负责24×7的值班。
2.4 二线支持
- 接收派单(事件处理请求),解决相关事件。
- 按照标准要求填写处理过程。
- 负责联络专家。
2.5 服务专员
接受客户服务请求,初步处理客户提交的事件,并反馈结果给用户,关闭工单。
3 输入
编号 | 输入项 | 来源 | 周期 |
1 | 通过纸质文件、邮件、电话和传真等提出的事件。 | 用户 | 日常运维 |
2 | 通过日常维护提出的事件。 | 运维支持人员 | 日常运维 |
3 | 问题管理给出解决方案和应急措施 | 问题管理流程 | 日常运维 |
4 | 变更管理给出的变更通知 | 变更管理流程 | 日常运维 |
4 输出
编号 | 输出项 | 去向 | 周期 |
1 | 问题 | 问题管理流程 | 日常运维 |
2 | 事件和事件处理过程及结果的记录(报表) | 事件经理 | 日常运维 |
5 相关定义和说明
5.1 事件的分类
为便于事件的合理分配以及有效汇总、统计和分析事件记录,并为问题、变更管理打好分类基础,事件应得到合理分类。其中一级分类为办公系统终端、基础设施、网络、主机、安全系统、基础应用、业务应用。
当影响范围为全体或紧急程度为特急时,此类事件可认为是重大事件,需按照紧急事件流程进行处理。
5.2 事件的优先级定义
公司事件管理流程中,事件影响范围用于衡量事件所影响业务及用户范围,分为8个等级。事件紧急程度用于衡量事件需要及时解决响应的程度,分为4个等级,根据事件管理流程按照事件影响范围和紧急程度,按照事件优先级的特定计算公式,事件被分为四个优先级:一般(1)、中(2)、高(3)、特高(4)。
5.3 技术升级时间表
支持 团队 升级 时限 事件 级别 | 一线支持(服务专员)升级到 二线支持 | 二线支持 升级到 专家支持 | 升级到 问题流程 |
紧急(5级) | 无 | 无 | 无 |
高(4级) | 2个小时 | 3个小时 | |
中(3级) | 8个小时 | 12个小时 | |
较低(2级) | 24个小时 | 最终期限前8个小时 | |
低(1级) | 48小时 | 最终期限前8个小时 | 超过最终时间 |
5.4 行政升级时间表
紧急(5级) | 升级阀值 | / | |||
报告范围 | |||||
高(4级) | 升级阀值 | 2个小时 | 3个小时 | 超过最终时间 | |
报告范围 | 服务专员/一线,被分派工单的二线 | 被分派工单的服务台/一线/二线,事件经理 | 事件经理及管理层 | ||
中(3级)
| 升级阀值 | 8个小时 | 12个小时 | 超过最终时间 | |
报告范围 | 服务专员/一线,被分派工单的二线 | 被分派工单的一线/二线,事件经理 | 事件经理及管理层 | ||
较低(2级) | 升级阀值 | 24个小时 | 最终期限前8个小时 | 最终期限前2小时 | 超过最终时间 |
报告范围 | 服务专员/一线,被分派工单的二线 | 被分派工单的一线/二线 | 被分派工单的一线/二线,事件经理 | 事件经理及管理层 | |
低(1级) | 升级阀值 | 48小时 | 最终期限前8个小时 | 最终期限前2小时 | 超过最终时间 |
报告范围 | 服务专员/一线,被分派工单的二线 | 被分派工单的一线/二线 | 被分派工单的一线/二线,事件经理 | 事件经理及管理层 |
5.5 事件的状态
事件处理流程中事件的相关状态定义见下表。
事件的状态 | 定义 |
已登记 | 已由服务专员登记 |
分派 | 事件已由一线发出,未被接受 |
返回 | 事件分配不当,返回服务专员 |
一线处理中 | 已分派到一线处理中 |
二线处理中 | 已分派到二线并接受 |
RFC | 已通过RFC提交解决方案 |
完成 | 一线/二线已解决事件 |
结束 | 事件已关闭(服务专员) |
6 事件管理流程描述
6.1 普通事件流程
序号 | 步骤 名称 | 责任人 | 说明 |
1 | 事件接受与记录 | 服务专员 |
|
2 | 分类与支持,调度分派 | 服务专员 |
|
3 | 分析处理 | 一线人员 |
|
4 | 二线调查诊断 | 二线人员 |
|
6 | 解决和恢复 | 一线支持 二线支持 |
|
7 | 反馈客户/关闭 | 一线支持 二线支持 |
|
8 | 审核并提交进入知识库 | 事件经理 |
|
9 | 紧急事件处理流程 | 事件经理 |
|
6.2 紧急事件流程
序号 | 步骤名称 | 说明 |
1 | 召集应急小组,协调应急会议 | 1. 事件经理主持应急会议,并组织讨论、协调各方资源,分析紧急事件处理方案; 2. 与此同时,事件经理还需将紧急事件上报上级公司信息部门。 |
2 | 判断是否属于应急预案中的事件? |
|
3 | 按照应急预案处理 |
|
4 | 组织相关厂商共同分析,制定处理方案并处理 |
|
5 | 紧急事件解除确认? |
|
6 | 善后处理和通报 |
|
7 表单和模板
名称 | 版本 | 负责人 | 说明 |
事件记录 | V1.0 | 沈立峰 | |
事件管理报告 | V1.0 | 沈立峰 | 对流程运行情况的报告 |
8 关键绩效指标(KPI)
事件管理的可选指标包括:
绩效指标 | 目标值 | 衡量方式 | 频度 | 负责人 |
事件总数 | 统计 | |||
事件的平均解决时间 | 4小时 | 统计 | 每日 | |
按优先级计算的平均解决时间 | 统计 | 每日 | ||
一线解决率 | 50% | 统计 | 每日 | |
超时未解决的事件数量 | 统计 | 每日 | ||
超时事件解决率 | 10% | 统计 | 每日 | |
事件一次解决率 | 80% | 统计 | 每日 | |
事件成功关闭数量比率 | 98% | 统计 | 每日 | |
正确转交的事件数量比率 | 95% | 统计 | 每日 |
9 流程质量控制
步骤 | 输入 | 步骤描述 | 输出 | 负责人 |
1 现有流程评估 | KPI、报告、流程执行过程中发现的问题 |
| 差距分析评估报告、趋势分析报告 | 事件经理 |
2 制定改进计划 | 差距分析评估报告、趋势分析报告 |
| 改进计划 | 事件经理 |
3 审批改进计划 | 改进计划 |
| 审批后的改进计划 | 事件经理 |
4 执行改进计划 | 被批准的改进计划 | 调动资源,组织相关人员执行被批准的改进计划。 | 实施后的改进计划、改进效果 | 事件经理 |
5 回顾 | 实施后的改进计划、改进结果 |
| 回顾结果 | 事件经理 |
10 与其它流程的接口
- 配置管理
需要从配置管理数据库中查询配置项的属性和配置项间的关联关系来定位故障和帮助快速的恢复。
- 问题管理
事件管理流程将提供事件的详细、精确的记录信息给问题管理流程来定位问题及分析问题的趋势,以及在优先级为高的事件解决并恢复服务后作为问题进行进一步的分析和处理。
- 变更管理
服务专员应了解变更管理流程中目前正在进行的变更信息,监测因变更引发的事件。在事件的解决过程中,必要时需要发起变更请求来解决事件。
- 服务级别管理
服务级别管理流程对SLA协议完成情况进行持续监控,事件流程相关人员必须全面了解SLA协议内容,以便在与用户进行沟通的时候可用到这些信息。有关事件记录的报告可用来判断是否真正地提供的规定级别的服务。
- 可用性管理
为了评估服务的可用性,可用性管理流程需要使用配置管理流程提供的事件记录和状态监控信息,例如事件处理期间导致的某项服务的“不可用”状态。
- 能力管理
能力管理流程关注由于能力(Capability)不足导致的事件,例如系统处理能力不足导致的处理响应时间过长。
11 术语定义
术语 | 定义 |
事件(Incident) | 在某一服务中不属于标准操作(standard operation)并且有可能导致IT服务中断或服务质量下降的任何事情(event)。 |
事件状态 | 事件状态代码表明事件所处的处理状态 |
事件分类 | 有故障和服务请求 |
事件影响度 | 事件影响度用于衡量事件所影响业务的严重程度 |
事件优先级 | 事件优先级定义了事件优先获得资源并得到处理的优先顺序 |
事件结束代码 | 事件结束代码说明了事件是在何种情况下关闭的 |
事件超时代码 | 事件超时代码用于标明事件的处理是否超过规定的时限 |
12 附则
本管理办法由技术部负责组织制定、解释和修改,各部门可根据本规定制定相应的实施细则。
本管理办法自印发之日起实行。
相关文件:
《信息技术服务管理手册》
《信息技术服务管理策略》
《服务报告流程管理办法》
《记录控制管理规定》
相关时间要求:
管理办法中规定的“每月”为每月10号前;
管理办法中规定的“每季度”为每季度第一个月10号前;
管理办法中规定的“每半年”为每半年度第一个月15号前;
管理办法中规定的“每年”为每自然年度第一个月20号前;
如遇节假日可顺延。