从版本< 12.1 >
由superadmin编辑
在2024/10/11, 20:00上
到版本
由superadmin编辑
在2024/10/11, 20:17上
< >
修改评论 该版本没有评论

Summary

Details

Icon Page properties
Content
... ... @@ -3,15 +3,15 @@
3 3  
4 4  = 目录 =
5 5  
6 -=== 一、问题管理设计目标 ===
6 +==== 一、问题管理设计目标 ====
7 7  
8 -=== 二、问题管理流程 ===
8 +==== 二、问题管理流程 ====
9 9  
10 -=== 三、问题管理相关表单、规范 ===
10 +==== 三、问题管理相关表单、规范 ====
11 11  
12 -=== 四、问题管理角色、职责 ===
12 +==== 四、问题管理角色、职责 ====
13 13  
14 -=== 五、问题管理考核标准 ===
14 +==== 五、问题管理考核标准 ====
15 15  
16 16  
17 17  = 一、问题管理设计目标 =
... ... @@ -58,12 +58,12 @@
58 58  = 二、问题管理流程 =
59 59  
60 60  
61 -== 问题管理流程概述 ==
61 +问题管理流程概述
62 62  
63 63  [[image:1728638145695-907.png]]
64 64  
65 65  
66 -== 问题管理流程步骤概述 ==
66 +问题管理流程步骤概述
67 67  
68 68  |问题检测与记录|(((
69 69  * 判断事件管理创建的问题是否受理
... ... @@ -94,9 +94,349 @@
94 94  
95 95  == ==
96 96  
97 -== 步骤一的流程说明:问题识别与记录 ==
97 +步骤一的流程说明:问题识别与记录
98 98  
99 -[[image:1728638291834-716.png]]
99 +[[image:1728647892425-490.png]]
100 100  
101 +== ==
101 101  
103 +步骤二的流程说明:问题分类与分派
104 +
105 +[[image:1728647855815-599.png]]
106 +
107 +
108 +步骤三的流程说明:问题调查与诊断
109 +
110 +[[image:1728647951312-388.png]]
111 +
112 +
113 +步骤四的流程说明:问题解决
114 +
115 +[[image:1728647983097-743.png]]
116 +
117 +
118 +步骤五的流程说明:问题关闭
119 +
120 +[[image:1728648010831-375.png]]
121 +
122 +
123 +步骤六的流程说明:问题跟踪与监控
124 +
125 +[[image:1728648035490-365.png]]
126 +
127 +
128 +
129 += 三、问题管理相关表单、规范 =
130 +
131 +问题管理相关表单 ~-~- 问题来源
132 +
133 +
134 +根据问题的来源不同,可以分为以下的问题来源代码:
135 +
136 +|(% style="width:50px" %)编号|(% style="width:123px" %)代码|(% style="width:948px" %)描述
137 +|(% style="width:50px" %)1|(% style="width:123px" %)紧急事件|(% style="width:948px" %)(((
138 +紧急事件恢复服务后关联提出的问题,以便进行紧急事件的根本原因分析
139 +
140 +【例如】:某日发生了一起集群无法切换的事件,导致某台主机发生故障后,没有切换到备用主机中去,从而影响了业务,紧急事件的处理人员在采取了手工切换的替代措施后,恢复了服务
141 +
142 +为了分析为什么会发生该重大事件,以及查看其他的集群是否也存在类似的问题,此时可以提出一个问题记录,以便对该紧急事件进行分析
143 +)))
144 +|(% style="width:50px" %)2|(% style="width:123px" %)未解事件|(% style="width:948px" %)(((
145 +故障无法成功解决或者使用变通方式暂时解决,需要找出根本解决方案
146 +
147 +【例如】:某应用系统内存经常爆满当机,暂时没有解决方案,只能通过重启临时解决,此时需要提出一个问题记录,找到问题的根源是开发上面的问题还是其他,再驱动根本解决。
148 +)))
149 +|(% style="width:50px" %)3|(% style="width:123px" %)运维工作|(% style="width:948px" %)(((
150 +二线支持在日常维护工作中提出的问题
151 +
152 +【例如】:维护专家在日常维护中发现,目前的数据库版本可能会存在着死锁、性能下降等方面的问题,此时就可以提出一个问题记录,以便分析
153 +)))
154 +|(% style="width:50px" %)4|(% style="width:123px" %)故障分析|(% style="width:948px" %)(((
155 +分析事件记录找出的问题
156 +
157 +【例如】:在定期的会议中,对某应用系统操作咨询类的事件进行分析后发现,上一阶段该类型的事件比平常的时候多了30%,超过了规定的阀值,这表明该应用系统操作有可能存在着一些潜在的隐患,此时就可以提出一个问题记录,以找出问题的原因并解决
158 +)))
159 +|(% style="width:50px" %)5|(% style="width:123px" %)失败变更|(% style="width:948px" %)变更失败后,可能需要生成一个问题进入后续的解决过程
160 +
161 +
162 +问题分类
163 +
164 +问题分类与事件分类同步,原因是: 问题单来源很大程度上来自事件,同步分类有助于完整转述信息 事件管理的“故障现象”和“故障根源”区别的分类方式对于描述问题同样具有很大意义。
165 +
166 +|分类|原则|上级分类
167 +|类别(Category)|分类原则以能够清晰描述技术条线,从框架角度区分事件为准,如CRM域、计费域、MSS|
168 +|子类(Type)|分类原则以能够准确定位事件所在系统、设备或者功能单元,指导事件分派到相应处理组为准,且需要兼顾服务台人员的判断能力,如OCS系统|类别
169 +|现象(Item)|分类原则以能够描述故障现象为准,如计费出错|子类
170 +|根源(Causation)|分类原则以能够描述故障根源为准,如数据错误|子类
171 +
172 +
173 +分类示例表:
174 +
175 +|类别|子类| |(((
102 102  
177 +)))
178 +|(% colspan="1" rowspan="4" %)计费域 ……|计费系统(HB)|现象|通话时长计算出错
179 +|统一充值系统(VC)|根源|账单计算出错
180 +|……| |数据错误
181 +| | |配置错误
182 +
183 +
184 +问题分派规范
185 +
186 +|**分派规范**|**描述**
187 +|规范一|基于目前管理状况,建议分派问题可以到技能组或岗位
188 +|规范二|可分派的人员组列表将根据问题分类和问题地点信息进行筛选
189 +|规范三|已分派的问题允许再次转派,组间转派到组,组内转派到人
190 +|规范四|再转派问题必须通过问题经理执行
191 +|规范五|组内转派问题不需要通过问题经理,可以直接转派
192 +|规范六|供应商等同于问题分析员,由问题经理直接分派
193 +
194 +
195 +问题严重等级规范
196 +
197 +问题的严重等级与事件管理同步,原因如下:
198 +
199 +* 问题单来源很大程度上来自事件,同步严重等级的计算方式有助于完整转述信息
200 +* 事件管理的“紧急程度”与“影响范围”交叉计算方式对于描述问题同样具有很大意义。
201 +
202 +
203 +问题严重等级(优先级)
204 +
205 +- 规则一:问题的严重等级由系统根据紧急程度和影响程度自动运算得出
206 +
207 + 计算规则如下表所示:
208 +
209 +|(% colspan="2" rowspan="2" %)**严重等级**|(% colspan="4" %)**影响程度**
210 +|**1级**(**极高)**|**2级**(**高)**|**3级**(**中)**|**4级**(**低)**
211 +|(% rowspan="3" %)**紧急程度**|**高**|极高|极高|高|中
212 +|**中**|极高|高|中|中
213 +|**低**|高|中|中|低
214 +
215 +问题紧急程度
216 +
217 +* - 规则一:问题的紧急程度划分为三级 ~-~-~-~- 高、中、低
218 +* - 规则二:问题紧急程度由用户或服务台按照“用户类型”和“分类”交叉运算得出
219 +* 规则三:没有明确用户类型的问题紧急程度默认为“中”
220 +* 规则四:投诉类事件和升级事件生成的问题紧急度默认为“高”
221 +
222 +|(% colspan="2" rowspan="2" %)**紧急程度(示例表)**|(% colspan="3" %)**用户类型**
223 +|**企业客户**|**VIP会员**|**普通会员和客户**
224 +|(% rowspan="3" %)**分类(三级)**|**计费出错**|高|中|低
225 +|**停开机出错**|高|中|低
226 +|**……**|高|中|低
227 +
228 + 问题影响程度 :
229 +
230 +* 规则一:问题影响程度由问题经理建单时主观定义
231 +* 规则二:问题的影响包括已经造成的或者可能会造成的影响
232 +* - 规则三:事件影响程度定义如下表所示
233 +
234 +|**影响程度**|**极高**|**高**|**中**|**低**
235 +|描述|(((
236 +重大的应用停机,影响很大数量的用户和业务单位。
237 +
238 +关键业务不能运行。
239 +)))|应用的使用受到重大限制;系统性能严重下降。|事件影响一小部分用户,属于一般性故障。|事件不直接影响生产,或是存在变通的方式。
240 +
241 +
242 +问题目标时间
243 +
244 +对于问题管理而言,处理的第一目标是从根本上解决问题,处理效率的考虑并不是最关键的 在这里我们使用“目标时间”来对处理效率进行衡量,主要是两点考虑:
245 +
246 +* 督促处理人员不要无限制的延误问题处理
247 +* 督促厂商的问题处理工作(厂商在问题处理中作为问题分析员角色)
248 +
249 +超过时间的问题单将执行超时上报
250 +
251 +
252 +| |**问题得到响应**|**问题单分派**|**问题得到解决**|**问题得到关闭**
253 +|**严重等级1**|8H|6H|3D|8H
254 +|**严重等级2**|1D|8H|5D|1D
255 +|**严重等级3**|2D|1D|10D|2D
256 +|**严重等级4**|3D|2D|20D|4D
257 +
258 +
259 +问题管理相关表单 ~-~- 问题状态
260 +
261 +状态代码用于鉴别事件和问题在处理过程中所处的状态。
262 +
263 +|**状态代码**|**描述**
264 +|**New(新建)**|**一个问题被记录或创建**
265 +|**Assigned (已分配)**|**一个问题已被分派给问题分析员或问题经理**
266 +|**Pending (等待中)**|**问题信息不完整,或在某些情况下阻止问题分析员对问题进行处理,进入等待**
267 +|**Work in Progress (处理中)**|**一个问题分析员接受了问题,并正在处理 **
268 +|**Resolved (已解决)**|**为一个问题找到解决方案或变通方法**
269 +|**Closed (已关闭)**|**问题已经关闭**
270 +
271 +
272 +问题流转状态说明
273 +
274 +纵向(左列)为原始状态,横向(上行)为目标状态。
275 +
276 +|**状态**|**新建**|**已分派**|**处理中**|**等待中**|**已解决**|**已关闭**
277 +|**新建 **| |**Y**|**N**|**N**|**N**|**N**
278 +|**已分派**|**N**|**Y**|**Y**|**N**|**N**|**Y**
279 +|**处理中**|**N**|**Y**| |**Y**|**Y**|**Y**
280 +|**等待中**|**N**|**Y**|**Y**| |**Y**|**Y**
281 +|**已解决**|**N**|**Y**|**N**|**N**| |**Y**
282 +|**已关闭**|**N**|**N**|**N**|**N**|**N**|
283 +
284 +
285 +问题等待代码
286 +
287 +* 当处理中的问题由于各种原因进入等待状态时,需要填写等待代码
288 +
289 +|**等待代码**|**描述**
290 +|等待进一步的信息|需要等待获取更多信息
291 +|等待变更管理处理|等待变更流程处理
292 +|由于不可抗力 |由于灾难、气候条件、交通条件等不可抗因素
293 +|等待维护性需求处理|等待维护性需求处理
294 +
295 +
296 +问题关闭规范
297 +
298 +|**关闭规范**|**描述**
299 +|规范一|问题单只能由问题经理关闭
300 +|规范二|问题单在关闭前,必须填写关闭代码
301 +|规范三|问题单不允许自动关闭
302 +|规范四|已关闭的问题单不允许重新打开
303 +
304 +|**关闭代码**|**描述**
305 +|成功解决|问题被正常解决
306 +|未发现根源|问题无法发现根源
307 +|解决失败|问题的解决方案失败,不能解决这个问题
308 +|问题撤销|问题经理撤销问题单
309 +|提交需求|问题单已提交需求管理流程处理
310 +
311 +
312 +问题通知规范
313 +
314 +|**规范**|**描述**
315 +|规范一|在创建问题单后,通知对应的问题经理
316 +|规范二|问题单分派后,通知被分派的问题分析员
317 +|规范三|问题分析员提交转派申请后,通知问题经理
318 +|规范四|问题分析员处理完成,通知问题经理
319 +
320 +
321 +问题管理相关表单 ~-~- 问题记录信息项
322 +
323 +问题记录信息项建议(包括但不限于)
324 +
325 +|序号|信息项|说明
326 +|**1**|**问题ID**|**为每个问题分配一个唯一的序列号(系统自动产生)**
327 +|**2**|**请求人信息**|**问题请求人的信息,包括:姓名、省/分公司、部门、电子邮件、办公电话、手机(手工填写)**
328 +|**3**|**登记时间**|**生成问题记录的时间(系统自动产生)**
329 +|**4**|**地点**|**记录问题发生的地点(手工填写)**
330 +|**5**|**问题来源**|**参见“问题来源”定义**
331 +|**6**|**事件影响度**|**参见“问题紧影响程度”定义**
332 +|**7**|**事件紧急度**|**参见“问题紧急程度”定义**
333 +|**8**|**问题优先级**|**参见“问题优先级”定义**
334 +|**9**|**问题分类**|**参见“问题所属系统类型”定义**
335 +|**10**|**问题标题**|**简单描述问题(手工填写)**
336 +|**11**|**问题描述**|**详细描述问题内容(手工填写)**
337 +|**12**|**问题原因**|**详细记录问题产生的根本原因(手工填写)**
338 +|**13**|**重复问题标记**|**标记为重复问题,用已有标题号标注(手工填写)**
339 +|**14**|**问题状态**|**参见“问题状态”定义**
340 +|**15**|**问题经理**|**问题经理**
341 +|**16**|**受理组**|**将问题分配到问题处理专家组(手工填写)**
342 +
343 +|序号|信息项|说明
344 +|**17**|**受理人**|**将问题分配到各问题处理专家(手工填写)**
345 +|**18**|**问题日志**|**反映问题处理过程中问题信息项的变化历史,包括分配的人员,状态等信息(系统自动产生)**
346 +|**19**|**实际开始诊断时间**|**问题状态更新为“分析中”的时间(手工填写)**
347 +|**20**|**实际诊断结束时间**|**问题状态更新为“已有解决方案”的时间(手工填写)**
348 +|**21**|**解决方案**|**问题解决方案的详细描述(手工填写)**
349 +|**22**|**问题等待代码**|**参见“问题等待代码”定义**
350 +|**23**|**问题结束代码**|**参见“问题结束代码”定义**
351 +|**24**|**备注项**|**解释问题拒绝原因,无法解决的原因等**
352 +|**25**|**关联配置项**|**记录问题的配置项代码(手工填写)**
353 +|**26**|**关联的事件单号**|**记录引发该问题的事件单号(手工填写)**
354 +|**27**|**关联的变更单号**|**记录由问题发变更时,关联的变更单号(手工填写)**
355 +|**28**|**问题关闭时间**|**当问题状态更新为“结束并关闭”的时间(手工填写)**
356 +|**29**|**附件**|**附件**
357 +
358 +
359 += 四、问题管理角色、职责 =
360 +
361 +问题管理 ~-~- 角色、职责定义
362 +
363 +**原则:**一个人员可以担任多个角色,同一角色也可以由多人担任
364 +
365 +|**问题管理角色**|**主要职责**|**岗位映射**
366 +|**流程负责人**|**推动、推广问题管理流程,对流程的整体效果和效率负责。**|
367 +|**问题分析员**|(((
368 +**接受问题经理分派过来的问题**
369 +
370 +**分析和诊断问题,确定根本原因**
371 +
372 +**确定和测试解决方案**
373 +
374 +**提交变更请求并监控变更实施**
375 +
376 +**协助事件支持人员进行重大或紧急事件的处理**
377 +
378 +**需要时协调第三方的资源来帮助诊断和改正问题**
379 +)))|(((
380 +**企信部所有技术人员,分为不同领域的各个技能组**
381 +
382 +**各厂商,按照各自负责系统分为各个技能组**
383 +)))
384 +|**问题经理**|(((
385 +**领导问题管理小组,确保大家的积极性、技能水平**
386 +
387 +**定期组织相关人员对事件记录进行分析,发现潜在问题**
388 +
389 +**确认和审核问题**
390 +
391 +**必要时对问题进行上报**
392 +
393 +**监视问题的诊断、分析和处理过程**
394 +
395 +**必要时与帮助台及问题请求者沟通问题的相关信息**
396 +
397 +**必要时协调所需资源**
398 +
399 +**定期制定问题报表,提供正确决策信息**
400 +)))|**建议多人担任,分别为各个技术团队的负责人(如各二线处理小组负责人)**
401 +
402 +
403 +
404 += 五、问题管理考核标准 =
405 +
406 +
407 + 问题管理 ~-~- 考核指标
408 +
409 +问题管理考核指标如下:
410 +
411 +|代码|状态|说明
412 +|(% rowspan="4" %)**流程
413 +有效性**|**问题总数**|(((
414 +**数量:在问题单中根据以下条件过滤**
415 +
416 +**1. 【重复问题标记】为空**
417 +
418 +**2. 【问题结束代码】不等于“取消”**
419 +
420 +**3. 【登记时间】在统计周期内**
421 +)))
422 +|**未解决故障问题所占比率**|(((
423 +**数量:在问题总数中,【问题来源】=“未解事件”的问题数量**
424 +
425 +**比率:数量 / 问题总数  × 100 %**
426 +)))
427 +|**故障分析问题所占比率**|(((
428 +**数量:在问题总数中,【问题来源】=“故障分析”的问题数量**
429 +
430 +**比率:数量 / 问题总数  × 100 %**
431 +)))
432 +|**关闭问题数量**|**数量:【问题关闭时间】在统计周期内,【问题状态】=“结束并关闭”的问题数量**
433 +|(% rowspan="2" %)**执行效率**|**问题成功解决率**|(((
434 +**数量:在关闭问题数量中,【关闭代码】=“成功解决”的问题个数**
435 +
436 +**比率:数量 /关闭问题数量  × 100 %**
437 +)))
438 +|**平均解决时间**|(((
439 +**完成问题数量:【结束时间】在统计周期内的问题个数**
440 +
441 +**平均解决时间:累加完成问题的(【实际结束时间】-【实际开始时间】)/ 完成问题数量**
442 +)))
Icon 1728648035490-365.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +77.8 KB
Content Icon
深圳市艾拓先锋企业管理咨询有限公司