1、综述

1.1 设计目的

本文档的目的是:

  1. 建立基于ITIL的业务支撑网事件管理的基本框架,提升业务支撑网的IT服务可用性
  2. 对集团公司和各省公司业务支撑网的事件管理进行规范化、统一化管理
  3. 指导业务支撑系统服务管理平台的建设 
1.2 适用范围

本文档作为本次项目的事件管理流程详细设计的交付物,读者对象为与事件管理流程相关的所有技术与管理人员。

1.3 相关术语

◆ ITIL(IT Infrastructure Library )

◆ 帮助台(Service Desk)

帮助台从根本上来说是提供了用户和IT部门的唯一接口。此项功能常通过集中方式提供服务。帮助台的根本目的是提供初始支持,并通过变通方法、解决方案或升级到一线、二线支持等手段帮助用户恢复到正常工作状态。

◆ 事件管理( Incident Management)

ITIL流程之一,事件管理负责解决所有的IT事件、问题和用户请求。它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找根本原因。

◆ 问题管理(Problem Management)

ITIL流程之一,问题管理负责解决重大紧急事件或具有相同症状的一组事件。它的目的是找出事件的根本原因,并通过解除该根本原因从而防止类似事件的再次发生。同时问题管理流程也负责预防事件的发生。

◆ 配置管理(Configuration Management)

ITIL 流程之一,配置管理负责描述,跟踪和汇报所有IT基础架构中的每一个设备或系统的管理流程。这些设备和系统被称为配置项(CI) 。每一个CI必须有效管理,跟踪和控制以支持公司的IT服务和基础设施成功运行。

◆配置管理数据库(CMDB - Configuration Management Database)

是在配置管理流程中用于记录企业所有IT相关配置项信息及其相互关系而建立的数据库。

◆变更管理(Change Management)

ITIL流程之一,变更管理通过控制和管理IT相关的变更, 使变更对生产环境可能的影响和风险降到最小,从而提高IT环境的整体稳定性。

2 事件管理流程设计

2.1 流程目的

事件管理流程的主要功能是尽快解决出现的事件,保持业务支撑系统的稳定性,其目的包括:

◆在成本允许的范围内尽快恢复IT服务

  • 快速响应服务请求(电话/Web/邮件等)
  • 用户在线获得帮助(知识库共享)
  • 沟通事件解决的状态
  • 和客户确认事件的解决

◆进行事件控制

  • 按规范记录事件
  • 就事件的优先级,影响度 进行分类
  • 分析,诊断,必要时进行升级
  • 监视并结束事件
  • 进行定期服务流程回顾

◆提供IT管理信息

  • 人力资源利用情况
  • 故障处理情况
  • 支持效率
2.2 流程主要内容

◆ 事件接收和记录

◆ 分类和在线支持

事件可以是一个申告/故障/告警/咨询/业务处理/维护作业,对于每个事件,需要确立优先级和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。

◆调查和诊断

◆ 解决和恢复

◆结束事件

2.3 与其他流程的关系

◆ 和问题管理流程的关系

事件管理流程将提供事件的详细、精确的记录信息给问题管理流程来定位问题及分析问题的趋势,以及在优先级为紧急的事件解决并恢复服务后做为问题进行进一步的分析和处理。

◆ 和配置管理流程的关系

需要从配置管理数据库中查询配置项的属性和配置项间的关联关系来定位故障和帮助快速的恢复。

◆ 和变更管理流程的关系

帮助台应了解变更管理流程中目前正在进行的变更信息,检测因变更而可能引发的事件。在事件的解决过程中,必要时需要发起变更请求来解决事件。

2.4 流程范围

业务支持中心的事件管理范围包括与BOSS、客服、经分、容灾、BOSS网管相关的所有IT生产环境所产生的申告、故障、告警、咨询、业务处理和维护作业。

本事件管理范围不包括尚处于开发或测试环境的系统和应用引发的事件。

2.5 流程执行原则
2.5.1 常规原则
  1. 所有业务支撑部门事件管理范围内发生的事件,都应该记录在服务管理平台中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的附件
  2. 所有IT支持人员对优先级为紧急和高的事件所采取的服务恢复行动,在比对其它行动的时候,将拥有优先处理级别
  3. 应该每月产生事件管理报表,并对重复发生的事件和变通方法解决的事件,应该举行定期的事件管理会议对这些事件进行评估
  4. 应该半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进事件管理流程
2.5.2 流程关联原则

◆ 和问题管理的关联

  • 所有优先级为紧急的事件在恢复服务后,都应该创建问题单(问题单必须和事件单建立关联)
  • 一线支持在解决事件的过程中,可以通过问题记录查找相应的解决方案

◆ 和变更管理的关联

  • 事件处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和事件单建立关联),变更完成后,继续事件单的处理
  • 紧急事件(优先级为紧急的事件,下同)的处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提出紧急变更请求,变更完成后,补录紧急变更单,并和紧急事件单建立关联

◆ 和配置管理的关联

  • 事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件、问题或变更,来帮助故障的定位
  • 事件处理过程中,如果可以将故障定位到某个配置项,则必须将事件单与该配置项关联
2.5.3 所有权原则

所有权原则用来确保每个事件在任何时段都有适当的人员负责,帮助台是事件的负责人。

  • 由IT用户申报的事件单,帮助台员工是该事件的责任人,必须确保事件得到有效跟踪与解决,并负责事件单的关闭
2.5.4 再分派原则

事件的再分派原则是确保事件在服务目标时段内处理和解决的重要因素。因此,应当尽量减少事件单再分派的几率。事件单可以分配到个人,或者分配到组(帮助台,一线支持,二线支持),再由组内的支持人员处理。事件单的重分派次数不应该超过5次。

  1. 帮助台可以将事件单分配给一线支持,如果找不到合适的一线支持,可以直接分配到二线支持
  2. 一线支持可以将事件单重新分配给帮助台,其他一线支持人员,二线支持
  3. 二线支持可以将事件单重新分配给帮助台,一线支持,其他二线支持人员
2.5.5 重复事件原则

重复事件是指在一个较短时间段(通常30分钟内至1小时),由监控平台上报的同一个配置项上现象相同的事件或一人/多人申告的同一来源(系统、应用)现象相同的事件。当被报告的事件与某个已经创建且尚未解决的事件单相同,则该事件被认为是重复的。由于此时已创建的事件尚未解决,还没有采取修正措施来恢复服务,因此,新报告的事件被认为是原有事件单的重复事件单。在原有事件单获得解决时,所有的重复事件单获得解决。

  1. 监控平台应该自动过滤重复告警,避免将重复的告警发送到服务管理平台
  2. 重复的事件信息必须被标识,并且不计入事件流程的关键衡量指标
  3. 如果帮助台可以判断到重复事件,则由帮助台对重复事件标识,否则由一线支持人员负责重复事件的处理
2.5.6 关闭原则

由IT用户申报的事件单,关闭必须由帮助台完成。

◆ 事件处理人员在解决完成事件时,根据实际解决情况填写事件的结束代码,采用临时措施恢复服务时,结束代码为“变通方法解决”。帮助台负责和IT用户再次确认事件的解决

  • 由IT用户认可获得关闭的事件单的结束代码为“成功解决”关闭
  • 已解决的事件单如果没有得到IT用户的认可,则首先关闭该事件单,结束代码修改为“不成功”,同时创建一个新的事件单重新分配到原处理人员继续处理

◆已关闭的事件单不允许重开。如果事件重复发生,则创建一个新的事件单

  1. 业务支撑部门的维护人员(一线或二线)自行创建的事件单,本着“谁开单,谁负责关闭”的原则
  2. 监控平台自动发送的事件单,第一次接收的维护人员负责关闭
  3. 对于IT用户(例如客服)申报的事件单,可以实现由IT用户自行确认事件是否解决,超过一定期限(例如3-5天)不确认的事件单由系统自动关闭或由帮助台协助关闭 
2.5.7 升级原则

制定升级原则的目的是确保事件在规定的解决时限内能够及时通知相关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。

  1. 优先级为紧急的事件,帮助台应立即升级到相应一线支持,由一线支持再次确认,如果确认了优先级为紧急,则立即升级到事件经理,并通知相应的管理层(通过服务管理平台),由事件经理启动紧急事件处理流程
  2. 各支持人员应及时响应和处理分配到本组或自己的事件单,如果超出规定的响应时限和解决时限,服务台系统应自动将事件信息通报事件经理,事件经理负责协调资源,并督促事件能够及时被响应和处理
  3. 帮助台和一线支持应及时将不能解决的事件升级到下一级,若未及时升级,事件经理应及时介入,负责协调升级处理
2.6 流程相关定义
2.6.1 事件信息项

事件单必须包含如下事件信息项,各省可以在此基础上扩充:

序号信息项说明
1事件ID事件单流水号(系统自动产生)
2请求人信息事件申报人的信息,包括:姓名、省/分公司、部门、电子邮件、办公电话、手机(手工填写)
3登记时间在帮助台生成事件记录的时间(系统自动产生)
4地点事件发生的地点 (手工填写)
5事件发生时间

针对故障:指的是业务中断的实际时间 (可能早于登记时间,需要手工填写)

针对其它:缺省值等于登记时间

6业务恢复时间针对故障的业务恢复实际时间(手工填写)
7事件性质参见“事件性质”定义
8事件来源参见“事件来源”定义
9事件影响度参见“事件影响度”定义
10事件优先级参见“事件优先级”定义
11事件完成期限对应每一个事件优先级,系统根据流程相关定义中“事件解决时限”自动设定最终的完成期限 (系统自动产生)
12事件所属系统类型参见“事件所属系统类型”定义
13事件分类参见“事件分类”定义
14事件标题事件的简要描述(手工填写)
15事件描述对于整个事件内容的详细描述(手工填写)
16事件解决人事件的最终解决人(手工填写)
17事件状态参见“事件状态”定义
18分配对象被分配的技术支持组和人员(手工填写)
19事件日志反映事件信息项的变化历史,如一个事件在处理过程中事件状态变化的时间点等信息(系统自动产生)
20解决方案事件解决方案的描述(手工填写)
21事件结束代码参见“事件结束代码”定义
22重复事件标记标记为重复事件(手工填写)
23处理是否超时参见“处理是否超时”定义(系统自动产生)
24事件解决人角色参见“事件解决人角色”定义
25实际开始时间记录事件状态到XX处理中的时间(系统自动产生)
26实际完成时间记录事件已解决的时间(系统自动产生)
27故障厂商记录故障厂商或集成商信息(手工填写)
28关联配置项记录出现故障的配置项代码(手工填写)
29关联的问题单号记录由事件引发问题时,关联的问题单号(手工填写)
30关联的变更单号记录由事件引发变更时,关联的变更单号(手工填写)
31外部系统工单号记录事件来自的外部系统的单号
32超时原因记录事件处理超时的原因描述
33投诉分类记录投诉类事件的所属投诉分类
34投诉条目记录投诉类事件的所属投诉条目
2.6.2 事件性质

根据系统的业务要求和管理要求,定义如下六类事件: 

编号代码描述
1故障

指因业务支撑系统错误或反映支撑系统部分或全部功能不能正常使用的报障;

监控管理平台上报的影响系统正常使用的告警

2申告与业务支撑系统相关的用户投诉,如1860、营业厅等面向客户的业务受理部门转来的因支撑系统问题引发的投诉
3告警监控平台自动产生的没有影响到系统正常使用的告警
4咨询指对系统操作、业务流程等方面的求助和询问
5业务处理指需要运维人员进行后台数据处理的请求,主要指业务参数、资费参数的修改和批量数据的处理
6维护作业

指运维人员的日常维护作业或临时进行的维护作业;

总部下发的维护作业

注:业务处理和维护作业的处理流程见流程概要设计相关子章节。

2.6.3 事件来源

事件来源代码用来标明事件的提出方式,事件来源可以包括以下几种:

编号代码描述
1用户报告用户或地市维护人员通过电话/邮件/传真报告的事件,帮助台人员手工创建事件单
2自助开单地市等IT用户通过服务台自助系统直接提交的事件
3自动转单通过客服系统自动转发的事件
4内部开单省公司业务支撑部门内部提交的事件
5监控告警监控工具自动转发过来的事件
2.6.4 事件所属系统类型

根据目前业务支撑系统和子类的划分定义事件所属系统类型,当事件发生时,应该由帮助台初步定位是哪个系统及子类出现问题,由一线、二线进行进一步的明确。

注:各省在细化设计时不能修改此表中现有定义,第一层业务系统和第二层子类不能修改和扩充(注:第一层为”其它系统”的话,对应的子类可以扩充),但可以有选择的基于第二层子类定义扩充进行第三层条目的细化。对没有覆盖到的业务系统用”其它系统”表示。

业务系统子类
BOSS系统营销管理
 
渠道管理
客户服务
产品管理
客户管理
资源管理
订单管理
服务开通
综合采集
融合计费
综合帐务
综合结算
合作伙伴管理
系统管理
统计报表
一级BOSS
其它
客服系统电话呼叫中心
互联网呼叫中心
短信呼叫中心
工单管理
知识管理
人力资源
质量管理
数据统计分析
其它
经营分析通用分析
专题分析
其它
容灾系统BOSS数据保护
BOSS业务接管
BOSS资源复用
 其它
BOSS网管监控管理
服务管理
其它
其它系统 
2.6.5 事件分类

事件分类代码用于标识故障或申告的具体原因,由支持人员在处理过程中填写。在制作统计报表时,可以通过和事件所属系统类型代码的结合来统计分析故障或申告。

事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。

注:各省可以在此表的基础上扩展子类和自定义条目,针对一个子类,可以定义多个条目。

类别子类
系统硬件路由器
网络交换机
小型机
PC服务器
磁盘阵列
存储光纤交换机
磁带库
光盘库
客服设备排队机
CTI服务器
CCS
IVR服务器
安全设施防火墙
IDS入侵监测系统
IPS入侵防护系统
防毒墙
安全软件
系统软件操作系统
数据库
中间件
集群软件
备份软件
系统管理软件
配套设施UPS
空调
其它
应用软件进程
数据
参数
代码
接口
2.6.6 事件优先级

优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级(紧急、高、中、低)。

编号优先级代码描述
1紧急
  1. BOSS系统中客户服务、客户管理、服务开通、综合帐务任一业务不可用,影响面为全省或至少包括一个关键地市
  2. 客服系统的电话呼叫中心业务不可用,影响面为全省或至少包括一个关键地市
  3. 因系统原因数据处理错误,导致大量用户投诉
  4. 来自新闻媒体、消费者协会、国家行政机关(工商、物价等)的反映或申告
  5. 部分重要数据丢失,且无法全部恢复
2
  1. BOSS系统中客户服务、客户管理、服务开通、综合帐务任一业务不可用,影响面为全省一个或多个非关键地市
  2. BOSS系统中综合采集、融合计费、产品管理、资源管理、一级BOSS、营销管理、渠道管理、合作伙伴管理、综合结算、系统管理、统计报表任一业务不可用,影响面为全省或至少包括一个关键地市
  3. 客服系统的电话呼叫中心业务不可用,影响面为全省一个或多个非关键地市
  4. 客服系统中互联网呼叫中心、短信呼叫中心、工单管理、知识管理、人力资源、质量管理、数据统计分析任一业务不可用,影响面为全省或至少包括一个关键地市
  5. 经分系统的通用分析不可用,影响面为全省
  6. 容灾系统的BOSS数据保护不可用,影响面为全省
  7. BOSS网管系统的服务管理或监控管理不可用,影响面为全省
  8. 用户在营业现场反应激烈
  9. 监控管理平台严重告警
3
  1. 一般性系统故障
  2. 监控管理平台主要告警
4
  1. 一般单个用户申告
  2. 业务咨询
  3. 监控管理平台一般告警

当故障发生时,为了在判断优先级时增强实际可操作性,可以根据故障的影响范围和业务系统的关键程度在优先级映射表中定位优先级。故障的影响范围可以根据配置项中定义的‘影响范围’和用户报障描述来确定。

系统                                影响范围全省至少包括一个关键地市全省多个非关键地市一个非关键地市

BOSS

(任意一个模块)

客户服务、客户管理、服务开通、综合帐务、订单管理紧急紧急
综合采集、融合计费、产品管理、资源管理、一级BOSS
营销管理、渠道管理、合作伙伴管理、综合结算、系统管理、统计报表

客服

(任意一个模块)

电话呼叫中心紧急紧急

客服

(任意一个模块)

电话呼叫中心紧急紧急
互联网呼叫中心、短信呼叫中心、工单管理、知识管理、人力资源、质量管理、数据统计分析
经分通用分析
专题分析 
容灾BOSS数据保护
BOSS业务接管、BOSS资源复用
BOSS网管服务管理、监控管理

注:

  1. 如果某些业务模块没有反映在优先级映射表中,各省可以根据实际需要添加
  2. 优先级映射表中空的字段,各省在细化流程中自行定义。
2.6.7 事件响应时限和解决时限

在事件处理过程中,对于一个事件有解决时间的限制和响应时间的限制,一方面,需要各工程师协同合作,在解决事件的时候应该有时间的概念,同时,也要求事件经理必须实时地督促事件的解决,对于影响度为高或者紧急的事件,需要及时通告事件经理,同时,如果该事件的响应或解决超过了时限,需要通告事件经理,同时也要根据具体情况通告给其他相关管理人员。

响应时限指的是事件状态从“已登记”到“一线处理中”经过的时间,如果帮助台直接分配到二线支持,响应时限指的是事件状态从“已登记”到“二线处理中”经过的时间;

解决时限指的是事件状态从“已登记”到“已解决”经过的时间;

编号优先级代码响应时限要求解决时限要求
1紧急30分钟4小时
21小时8小时
34小时48小时
48小时96小时

注:

◆ 事件通告定义

  • 通知人员列表的用途:当优先级为高或紧急的事件发生时,则按表中的人员列表发出邮件或短信通知。
优先级别通知人员列表
紧急事件经理,分管领导
事件经理,分管领导

◆ 超出响应时间的通告定义

  • 通知人员列表的用途:当服务管理平台判断到响应时限已经超出,则自动按照表中的人员列表发出邮件或短信通知。
优先级别通知人员列表事件响应时限
紧急事件经理,分管领导,部门领导30分钟
事件经理,分管领导1小时
事件经理4小时
事件经理8小时

◆超出和即将超出解决时限的通告定义

  • 通知人员列表的用途:当服务管理平台判断到解决时限已经或即将超出,则自动按照表中的人员列表发出邮件或短信通知。
优先级别通知时间通知人员列表事件解决时限
紧急3小时事件经理,分管领导,部门领导4小时
4小时事件经理,分管领导,部门领导
7小时事件经理,分管领导8小时
8小时事件经理,分管领导
47小时事件经理48小时
48小时事件经理
95小时事件经理96小时
96小时事件经理
2.6.8 事件影响度

事件影响度用于衡量事件所影响业务的严重程度。严重程度通常通过事件所影响的人数、关键系统数以及服务故障所造成的损失来设定。

定义事件影响度等级的因素有:

  1. 是否影响了核心业务
  2. 所影响的用户数
  3. 服务失效的影响范围和时长

事件影响度在事件的生命周期中是可以改变的,例如,初始等级为严重的故障会随着服务失效的时间变成重大故障,所以事件的影响度应在事件得到解决(服务恢复)后重新确认。

事件的响应时间、解决时限以及处理事件所需要引入的资源主要由事件的优先级决定。

编号影响度代码事件性质描述
1重大故障
  1. 全省半数以上地市或关键地市的融合计费业务中断超过6小时;
  2. 全省半数以上地市或关键地市的营业、综合帐务、客服中任一业务中断超过3小时;
  3. 全省半数以上地市或关键地市的综合结算业务处理中断超过24小时;
  4. 半数以下地市全业务中断超过6小时;
申告
  1. 对移动公司造成巨大损失产生严重后果和不良影响的;
  2. 来自新闻媒体、消费者协会、国家行政机关的反映或申告;
2严重故障
  1. 全省半数以上地市或关键地市的融合计费业务中断大于10分钟、小于6小时;
  2. 全省半数以上地市或关键地市的营业、综合帐务、客服等业务中断均大于10分钟、小于3小时;
  3. 全省半数以上地市或关键地市的综合结算业务处理中断大于2小时、小于24小时;
  4. 半数以下地市全业务中断大于10分钟、小于6小时。
申告
  1. 局数据错误导致产生大量的错单;
  2. 涉及到高额问题的申告;
  3. 用户在营业现场反映激烈
3一般故障
  1. 系统内局部出现问题,不影响整个系统运行,不影响业务处理的故障
申告
  1. 不属于重大申告和严重申告的用户申述
告警
  1. 不影响系统的监控平台告警
4咨询
  1. 一般数据查询或者使用指导

注:各省根据自己业务情况扩展或修改本表格的描述,对于重大级别的事件,应严格按照集团公司的定义。

2.6.9 事件状态

事件状态代码表明事件所处的处理状态,事件状态如下:

编号代码描述
1已登记新开事件记录或事件已创建
2分配到帮助台事件已分配给帮助台人员
3分配到一线事件已分配到一线支持,一线还未响应
4分配到二线事件已分配到二线支持,二线还未响应
5一线处理中一线支持人员已接手处理事件
6二线处理中二线支持人员已接手处理事件
7已解决事件已解决,支持人员联系用户验证事件是否获得解决
8关闭事件已关闭
2.6.10 事件结束代码

事件结束代码说明了事件是在何种情况下关闭的,结束代码如下:

1成功解决事件获得成功解决
2变通方法解决事件已通过变通方法或者临时措施获得解决,但是需要进行更进一步的根源分析
3不成功事件没有获得解决(用户没有认可解决时使用)
4消失事件自行消失
5误报不属于业务支撑部门管理范围的事件
6可忽略如通过其它系统接口或监控系统提交的垃圾信息,经确认属于无效信息
2.6.11 事件解决人角色

事件解决人角色用来标明该事件单最终解决的角色是帮助台、一线还是二线。

编号代码描述
1帮助台帮助台最终解决事件
2一线一线支持最终解决事件
3二线二线支持最终解决事件
2.6.12 处理是否超时

每个优先级别都对应了解决期限,“处理是否超时”用来标明事件的处理是否已超过了解决期限。

编号代码描述
1未超时未超时
2超时事件已超出规定的解决时限
2.6.13 故障厂商

用来在事件单中记录是哪个厂商的设备/系统,或者哪个集成商的应用软件发生故障(针对事件分类中的”应用软件”故障)。代码定义参见下表厂商和集成商名称标准(可以根据情况从厂商和集成商两个表中选择一个合适的故障厂商)。

各省可以根据实际情况对厂商名称标准表和集成商名称标准表进行扩充。

编号厂商名称

1.

3COM

2.

AVAYA

3.

BEA

4.

BMC

5.

Borland

6.

CA

7.

Cisco

8.

DB2

9.

EMC

10.

HDS

11.

HP

12.

IBM

13.

Informix

14.

McDATA

15.

Microsoft

16.

NCR

17.

NETAPP

18.

Oracle

19.

Quantum ATL

20.

STK

21.

SUN

22.

Sybase

23.

TERADATA

24.

北电

25.

东方通

26.

中兴

27.

华为

28.

SYMANTEC

29.

QUEST

30.

REDHAT

31.

BROCADE
编号集成商名称

1.

亚信

2.

联创

3.

斯特奇

4.

神州数码

5.

华为

6.

新大陆

7.

亿阳

8.

神州泰岳

9.

创我

10.

新宇

11.

从兴
2.6.14 投诉分类

对于投诉类事件,帮助台可初步定位是哪类投诉,由一线、二线进行进一步的明确。

编号分类           
1营业类
2计费类
3帐务类
4资费类
5SP类
6开关机类
7冲值类
8接口类
9其它类
2.6.15 投诉条目

对于投诉类事件,帮助台可初步定位投诉属于哪个条目,由一线、二线进行进一步的明确。

编号条目                  
1程序问题
2系统故障
3理解问题
4用户数据
5话单延迟
6三批问题
7操作失误
8流程问题
9处理积压
10同步问题
11查询问题
12数据问题
13彩铃功能
14彩铃费用
15彩铃其它
16其它SP
17指令延迟
18HLR问题
19SCP问题
20接口问题
21到帐延迟
22网上营业厅
23短信营业厅
24自助终端
25银行联网
26智能网
27V网
28天府卡
29客服系统类
30需求类
31查询类
32误操作类
33其它类
2.7 流程概要设计

事件管理概要设计流程图如下:

微信图片_20240412192813.png

事件管理概要设计流程说明

序号步骤名称责任人说明
100.1事件记录和分类帮助台
  1. 帮助台对来自用户和系统自动产生的事件进行详细记录,其中包括申告/咨询/告警/故障/维护作业/业务处理
  2. 帮助台负责在接收到事件后进行分类转发,维护作业/业务处理转相应子流程处理,对申告/咨询/告警/故障类事件进行分类转发
  3. 对于初步判断为紧急的事件马上升级到一线人员处理
  4. 对于非业务支撑维护职责范围的事件转给其它相关责任部门
100.2初始支持帮助台
  1. 属于帮助台技能范围内可以处理的事件,帮助台应尝试解决,如果无法解决需及时升级到一线支持
  2. 不属于帮助台职责范围的事件,立即分派到相应的一线支持
100.3一线尝试解决一线支持
  1. 一线支持人员在接受到由帮助台派发的事件后,进行调查诊断,尝试解决
  2. 对于需要通过变更解决的事件提出变更申请,通过变更流程实施解决方案
  3. 事件解决后,在事件管理平台记录事件解决方案并更新事件状态
  4. 不能解决的事件,转100.4二线尝试解决
100.4二线尝试解决二线支持
  1. 二线支持人员接受事件,进行调查诊断,尝试解决方案,在必要时根据服务协议联系厂商帮助解决并负责核查
  2. 对于需要通过变更解决的事件提出变更申请,通过变更流程实施解决方案
  3. 事件解决后,在事件管理平台记录事件解决方案并更新事件状态
  4. 指定时限内不能解决的事件,通告事件经理,由事件经理负责协调资源
100.5紧急事件再确认一线支持
  1. 一线支持人员接受到来自帮助台的紧急事件后,根据事件优先级别标准再次确认事件是否为紧急事件
  2. 如果优先级确实紧急,则通知相应的管理层,并立即升级到事件经理,转101紧急事件处理子流程
  3. 如不是,转100.3一线尝试解决,开始正常事件解决流程
100.6记录解决方案细节

帮助台

一线支持

二线支持

  1. 在事件得到解决后,各线支持人员负责详细记录事件解决过程及方案并更新事件信息
  2. 针对故障,一线/二线支持必须记录业务恢复时间
100.7关闭事件

帮助台

一线支持

二线支持

  1. 帮助台与申报用户确认事件是否已得到解决,如果解决,事件以成功解决或变通方法解决而关闭;否则,事件以不成功关闭,重新开事件记录,并与原记录做关联,分派到原处理人员继续处理
  2. 帮助台在关闭事件的同时必须确认事件单记录的业务恢复时间是否准确
  3. 其它由一线或二线人员自行创建的事件单,则由开单人负责关闭
100.8事件处理的监控事件经理
  1. 负责监控所有未关闭的事件的处理状况,对接收到的超时告警应及时关注,并负责协调资源,保证事件的最终解决
  2. 当事件优先级为紧急时,应按照紧急事件处理流程处理紧急事件
101紧急事件处理流程事件经理
  1. 事件经理负责协调紧急事件的处理,具体过程见紧急事件处理子流程
102维护作业子流程

一线支持

二线支持

  1. 根据业务支撑部门核准后的年度维护作业计划/月维护作业计划,集团公司下发的维护作业请求执行相应的维护作业。
  2. 维护作业执行人员负责维护作业的关闭
103业务处理子流程

一线支持

二线支持

  1. 业务处理子流程主要处理业务参数、资费参数的修改和批量数据的修改
  2. 基本的处理过程应该包含制定方案、执行、复核,各省可以根据自己的运作情况具体细化
2.8 流程详细设计
2.8.1(100.1)事件记录和分类

20.png

流程描述如下:

序号步骤名称责任人输入输出说明
100.1.1从任务队列中接受事件帮助台事件队列需要处理的事件

事件任务队列的来源:

  1. 监控系统自动发送的告警
  2. 业务部门通过其它接口(客服等)转发的事件单
  3. IT用户通过服务台自助系统提交的事件单

帮助台负责检查事件任务队列中的新事件单,开始处理

 

 是否为本中心职责范围?帮助台事件单 

帮助台判断是否属于本中心职责范围:

  1. 是,进行事件分类的处理;
  2. 否,转100.1.3回复和关闭
100.1.2新建事件帮助台电话/OA/传真新建的事件记录

属于本中心职责范围,帮助台负责创建新的事件单,填写详细情况描述,不属于本中心处理的,直接电话回复。

事件单填写的详细内容如下:

  1. 报告人姓名、联系电话、邮件、分公司、部门
  2. 事件标题和描述
  3. 必要的附件
  4. 事件发生时间和地点
  5. 事件来源和事件性质
  6. 进行事件分类
  7. 设定事件状态为“新建”
100.1.3回复和关闭帮助台误报的事件单关闭的事件单联系申报用户,说明情况,将该事件单状态置为“关闭”,结束代码为“误报”,保存关闭
 是否为重复事件?帮助台事件记录相应的处理流程

帮助台根据重复事件原则,判断该事件单是否属于重复事件:

  1. 是,转100.1.4重复事件处理;
  2. 否,事件分类的判断
100.1.4重复事件处理帮助台重复事件 在重复事件单的“重复事件标记”中记录正在处理的事件单的流水号,状态置为“XX处理中”,保存退出。
 事件性质区分?帮助台事件性质相应的处理流程

根据事件性质区分不同的处理流程:

  1. 如果是业务处理,走103业务处理子流程;
  2. 如果是维护作业,走102维护作业子流程;
  3. 其它事件,走100.1.5事件影响度、优先级设定

 

100.1.5事件影响度、优先级设定帮助台事件记录确定了影响度和优先级的事件根据上报的事件描述,判断对业务的影响程度,并对照优先级代码表,确定事件的优先级,以及初始确定的影响度
 优先级为紧急吗?帮助台事件优先级相应的处理流程

帮助台根据业务的影响程度和事件优先级判定的条件,初步判断优先级别:

  1. 优先级为紧急,转100.5紧急事件再确认;
  2. 其它优先级否,转100.2初始支持

2.8.2 (100.2)初始支持

28.png

流程描述如下:

序号步骤名称责任人输入输出说明
 帮助台技能可以处理吗?帮助台事件记录处理方式

帮助台根据事件分类和事件描述,判断处理职责是否在帮助台:  

  1. 是,转100.2.1尝试处理;
  2. 否,转100.2.2分配到一线支持
100.2.1尝试处理帮助台事件记录 帮助台运用知识库和自身技能在规定的时限内尝试解决,将事件状态置为“分配到帮助台”,如果不能处理应及时将事件单分配到一线支持
100.2.2分配到一线支持帮助台事件记录分配到一线的事件单选择相关的一线处理组和处理人员分派,并将事件状态置为“分配到一线”
 解决了吗?帮助台  

将解决方案和用户沟通,判断是否可以解决;

  1. 可以解决,转100.6记录解决方案细节
  2. 无法解决,转100.2.2分配到一线支持
2.8.3 (100.3)一线尝试解决

32.png

流程描述如下:

2.8.4 (100.4)二线尝试解决

07.png

 

Tags:
Created by superadmin on 2024/04/12, 16:22
     
深圳市艾拓先锋企业管理咨询有限公司