Show last authors
1 (% style="text-align:center" %)
2 [[image:1728895355808-419.png]]
3
4
5 目  录
6
7 问题管理流程介绍
8
9 问题管理流程现状
10
11 问题管理流程设计
12
13 问题管理角色设计
14
15 问题管理的规则设计
16
17 问题管理的KPI设计
18
19 问题管理的参考数据设计
20
21
22
23 = 1、问题管理流程介绍 =
24
25
26 (% style="text-align:center" %)
27 [[image:1728895406094-365.png]]
28
29
30 问题与的事件区别
31
32 事件是任何操作上的故障,而这些不是标准服务的一部分, 会导致服务中断或者是服务质量降低。
33
34 问题是导致一个或多个事件的根本原因,而这些根本原因还没有诊断出来。
35
36 已知问题(Known Error)是已找到根本原因的问题。
37
38
39 问题管理是一个后线流程,旨在通过调查事件的根源和除去问题根源,改进IT基础设施的质量和稳定性。通过主动或者是被动的手段对IT基础设施的跟踪,把问题解决,降低对事件的影响并且防止问题再现。
40
41
42 (% style="text-align:center" %)
43 [[image:1728895443972-445.png]]
44
45
46 问题管理流程的目标:
47
48 在IT基础设施范围以内,减低因发生所产生的不利影响,并防止事件的再度出现。为达到这个目标,问题管理寻找事件的根源,然后通过行动改进或者是纠正。
49
50 问题管理流程可以利用主动或者是被动的手段达到这个目标。在被动方面,是对一个或者是多个问题作出解决问题的反应。在主动方面,是将鉴别问题、解决问题放在第一位。
51
52
53 问题管理流程的任务:
54
55 改进IT基础设施的质量和稳定性。
56
57
58
59 (% style="text-align:center" %)
60 [[image:1728895474777-145.png]]
61
62
63 (% style="text-align:center" %)
64 [[image:1728895490406-880.png]]
65
66
67 (% style="text-align:center" %)
68 [[image:1728895510860-952.png]]
69
70
71 …主动问题管理
72
73 主动问题管理通过改进基础架构防止突发事件的发生。主动问题管理包括::
74
75 趋势分析
76
77 反复发生的问题和事件
78
79 变更后发生的事件和问题
80
81 故障分类
82
83 定位支持行动
84
85 更换配置项
86
87 减少单点故障
88
89 流程上的改进
90
91 研究关于其他知识和已知错误的知识
92
93
94 (% style="text-align:center" %)
95 [[image:1728895540422-398.png]]
96
97 问题管理的方案和范围是广阔的
98
99 系统和系统组件
100
101 • 系统软件
102
103 • 数据库
104
105 • 应用软件
106
107 • 网络软件
108
109 • 硬件
110
111 •服务器
112
113 •台式机
114
115 •通讯设备
116
117 •网络
118
119 • 环境系统
120
121 • 文档
122
123
124 (% style="text-align:center" %)
125 [[image:1728895574680-592.png]]
126
127
128 (% style="text-align:center" %)
129 [[image:1728895587177-979.png]]
130
131 = =
132
133 = =
134
135 = 2、 问题管理流程现状 =
136
137 ----
138
139 (% style="text-align:center" %)
140 [[image:1728895604499-699.png]]
141
142
143 (% style="text-align:center" %)
144 [[image:1728895713778-890.png]]
145
146 (% style="text-align:center" %)
147 [[image:1728895749809-648.png]]
148
149
150 * 值班经理担当问题经理,工作分担过重,无法行使监督的职责
151 * 问题流程发起均由事件触发而没有主动发起
152 * 问题记录时未进行信息明确或者补充
153 * 问题记录后未做问题分析和级别分类,也未做工作时间或者程度上的要求和政策策略,因此无法开展问题后续管理
154 * 现在角色分配无明确分工
155 * 问题关闭后也未验证问题是否解决
156 * 没有建立起相应解决方案知识库和问题知识库
157
158
159
160 = 3、问题管理流程设计 =
161
162 (% style="text-align:center" %)
163 [[image:1728895782281-307.png]]
164
165
166 (% style="text-align:center" %)
167 [[image:1728895809572-723.png]]
168
169
170 问题管理流程总体政策:
171
172 * 只有当事件单关闭时,才能建立问题单,通过对事件单关闭代码的选择,触发系统自动建立问题单机制。
173 * 针对应用类问题与基础架构类问题,在项目应用处与系统运行处分别设置一定数量的问题经理。
174 * 为实现效益与质量的平衡,问题的解决应是逐步推进的,在前期不应该追求100%的解决率,相关部门可以共同协商问题解决率,有选择的解决问题,待组织能力提升后,再协商更高级别的问题解决率。
175
176
177 问题管理流程的概要流程图
178
179 (% style="text-align:center" %)
180 [[image:1728895872043-354.png]]
181
182 (% style="text-align:center" %)
183 [[image:1728895888610-632.png]]
184
185
186 (% style="text-align:center" %)
187 [[image:1728895904320-371.png]]
188
189 (% style="text-align:center" %)
190 [[image:1728895917757-736.png]]
191
192
193 (% style="text-align:center" %)
194 [[image:1728895932842-489.png]]
195
196 (% style="text-align:center" %)
197 [[image:1728895944427-985.png]]
198
199
200
201 = 4、问题管理角色设计 =
202
203 (% style="text-align:center" %)
204 [[image:1728895968945-456.png]]
205
206 (% style="text-align:center" %)
207 [[image:1728895988382-997.png]]
208
209
210 问题管理流程负责人:
211
212 * 全面负责流程的效率和成果;
213 * 建立考核和目标,以提升流程的有效性和效率;
214 * 为保障流程的有效性,需争取高级管理层承诺投入足够的资源;
215 * 鉴别和管理关键的流程成功要素;
216 * 控制和领导流程的改进;
217 * 批准和拒绝偏离流程的请求;
218 * 定义问题管理的角色、责任和应负的责任;
219 * 定义目标、流程、工作流、政策和规则,并与相关人员进行沟通;
220 * 强制问题管理流程的执行;
221 * 确保对流程的使用者提供适当的教育;
222 * 对其他流程负责人和管理层汇报流程的状况和进度;
223 * 解决需要跨越职能部门的问题,如有需要,应升级汇报;
224 * 召开和主持对问题管理流程改进的季度会议;
225 * 作为问题管理流程对外的代表;
226 * 在适当的时候,问题管理流程负责人可以把部分责任委任给其他人员;
227
228
229 (% style="text-align:center" %)
230 [[image:1728896029935-959.png]]
231
232 问题经理:
233
234 * 确定并协调必要资源来处理所有(潜在)影响服务级别的所有类型问题,最小化问题的负面影响;
235 * 领导问题管理小组,确保员工的积极性、技能水平和绩效表现;
236 * 发现造成问题的可能原因,将问题分派给有能力将其解决的问题分析员;
237 * 跟踪问题解决的过程,必要时进行升级以及问题升级后的协调工作;
238 * 将关键问题的解决状态及时地通报给相应的人员和管理层;
239 * 确保制定清晰有效的工作流程和准则;
240 * 判断问题处理结果,关闭问题单或重新分派问题单;
241 * 在问题处理时可调整问题分析员;
242 * 确保所有相关人员都足够程度地引入到问题管理的流程中。
243
244
245
246 (% style="text-align:center" %)
247 [[image:1728896082466-414.png]]
248
249 问题分析员:
250
251 * 通过在某一方面的专业知识和技能(网络或应用)来支持问题管理经理,确保的快速解决和IT服务的快速恢复;
252 * 接受来自问题管理经理分派的问题;
253 * 基于影响度/优先级和分类代码执行问题分析,在规定的时间范围内调查可能的根本原因,测试解决方案,同时确保问题得以解决;
254 * 协调变更管理功能,实施解决方案;
255 * 不但使发生时把它的影响降到最小,还应根除的根本原因从而防止事件的再次发生;
256 * 利用现有IT环境分析历史数据来改善IT系统和工作方法从而避免潜在问题的发生;
257 * 在必要时修正或问题的影响度和分类编码;
258 * 在服务中断时,尽快提供临时解决方案,帮助客户尽快恢复正常工作状态;
259 * 提供问题的正确状态、进展和历史信息。
260
261
262 问题管理流程的角色与人员映射
263
264 (% style="text-align:center" %)
265 [[image:1728896130667-285.png]]
266
267
268
269
270 = 5、问题管理的规则设计 =
271
272 = =
273
274 (% style="text-align:center" %)
275 [[image:1728896169322-889.png]]
276
277
278 (% style="text-align:center" %)
279 [[image:1728896183835-373.png]]
280
281
282 * 所有管辖范围内的问题都会通过问题管理流程处理;将通过流程中定义的标准、政策和指导进行管理。
283 * 所有报告问题的部门将会参与统一的问题管理流程,不应该有任何例外。
284 * 应该定期产生和回顾问题管理报表。对没有解决的问题,应该举行定期的问题管理会议对这些问题进行评估。
285 * 应该定期对流程进行回顾,以改进问题管理流程。
286
287
288 (% style="text-align:center" %)
289 [[image:1728896212443-453.png]]
290
291 (% style="text-align:center" %)
292 [[image:1728896225737-660.png]]
293
294
295 (% style="text-align:center" %)
296 [[image:1728896238267-903.png]]
297
298 (% style="text-align:center" %)
299 [[image:1728896258861-645.png]]
300
301
302 通过通知政策进行沟通的问题信息可以通过电子邮件或者短信等方式发送,并将遵循标准的格式。下列的几个通知内容项应当以容易理解的方式进行描述:
303
304 * 问题单编号
305 * 问题描述
306 * 问题优先级
307 * 问题单严重等级
308 * 问题单状态
309 * 问题单建单时间
310
311
312 重复政策
313
314 (% style="text-align:center" %)
315 [[image:1728896301703-268.png]]
316
317 如果对于问题的分析发现与其他问题的根本原因相同,则此问题是一个重复问题。将此问题单与原始问题单相关联,标注此问题单为“重复”,原始问题单为“主问题”。
318
319
320 复发政策
321
322 (% style="text-align:center" %)
323 [[image:1728896359084-645.png]]
324
325
326 如果报告的问题与已经关闭的问题相同,该问题被认为是“复发”的问题单。这意味着为了解决问题而采取的解决措施失败了。此时应当创建一个新的问题单,复制原始问题单的内容,并说明这是复发的问题。
327
328
329 重开政策
330
331 (% style="text-align:center" %)
332 [[image:1728896387083-750.png]]
333
334 已关闭的问题单原则上不允许重新打开。如果问题复发,则创建一个新的问题单,并复制原始内容到新创建的问题单中。
335
336
337
338 = 6、问题管理的KPI设计 =
339
340 (% style="text-align:center" %)
341 [[image:1728896432163-521.png]]
342
343
344 (% style="text-align:center" %)
345 [[image:1728896450234-335.png]]
346
347 * 每一类问题数量占问题总量的比例(%)
348 ** 了解IT基础设施在哪些方面(网络、服务器等)存在问题较多
349 * 问题成功得到解决的比例(%)
350 ** 在一定时间范围内,成功得到关闭的问题数量占总问题量的百分比
351 * 优先级为高的问题所占比例(%)
352 ** 当前处理的任务中,有多少是优先级最高的问题,代表着IT基础架构和管理中的薄弱环节
353 * 已处理问题的平均时间统计
354 ** 成功得到关闭的问题平均处理时间,了解问题整体处理的效率。
355 * 申请变更的问题~(%)
356 ** 统计问题处理过程中涉及到CI变更的问题比例
357 * 各类别重复问题~(%)
358 ** 统计各类问题处理过程中问题为重复问题占总问题数量的百分比
359 * 已知错误问题~(%)
360 ** 统计问题处理过程中问题为已知错误问题占总问题数量的百分比
361
362
363 注:可增加以人或者部门为单位的KPI
364
365
366
367 = 7、问题管理的参考数据设计 =
368
369 (% style="text-align:center" %)
370 [[image:1728896537296-510.png]]
371
372
373 问题单的输入项-1
374
375 (% style="text-align:center" %)
376 [[image:1728896558390-618.png]]
377
378
379 问题单的输入项-2
380
381 (% style="text-align:center" %)
382 [[image:1728896583457-406.png]]
383
384
385 问题单的输入项-3
386
387 (% style="text-align:center" %)
388 [[image:1728896614860-455.png]]
389
390
391 问题单的输入项-4
392
393 (% style="text-align:center" %)
394 [[image:1728896633091-411.png]]
395
396
397 问题根源-1(初定)
398
399 (% style="text-align:center" %)
400 [[image:1728896650876-257.png]]
401
402
403 问题根源-2(初定)
404
405 (% style="text-align:center" %)
406 [[image:1728896671600-505.png]]
407
408
409 问题单的状态
410
411 (% style="text-align:center" %)
412 [[image:1728896689199-545.png]]
413
414
415 问题单的等待原因代码
416
417 (% style="text-align:center" %)
418 [[image:1728896712786-357.png]]
419
420
421 问题单的关闭代码
422
423 (% style="text-align:center" %)
424 [[image:1728896747076-926.png]]
425
426
427
深圳市艾拓先锋企业管理咨询有限公司