由 superadmin 于 2024/10/10, 21:02 最后修改
Summary
Details
- Page properties
-
- Content
-
... ... @@ -4,9 +4,9 @@ 4 4 = ** ITIL问题管理流程需求说明书** = 5 5 6 6 7 -=== **1 流程目的** === 7 +=== **1. 流程目的** === 8 8 9 -★问题管理流程的主要功能是消除或减少事件的发生,对于重复发生的事件以及原因不明的事件、以及工作中主动发现的问题须使用问题管理流程进行解决,保持中国 移动南方基地 IDC 业务支撑系统的健康性,其目的包括:9 +★问题管理流程的主要功能是消除或减少事件的发生,对于重复发生的事件以及原因不明的事件、以及工作中主动发现的问题须使用问题管理流程进行解决,保持中国XX南方基地 IDC 业务支撑系统的健康性,其目的包括: 10 10 11 11 * 在成本允许的范围内尽快降低关联事件的重复发生 12 12 * 关联重复发生的事件 ... ... @@ -28,21 +28,21 @@ 28 28 === **2. 流程主要内容** === 29 29 30 30 31 -问题(Problem)是导致事件产生的根源。问题管理流程是事件管理流程的延展部分,用于处理大量重复发生的事件以及原因不明的事件,要求独立使用资源进行解决,并根据中国 移动南方基地 IDC 现实运维情况排程实施问题的解决方案。该流程包含下述主要内容:31 +问题(Problem)是导致事件产生的根源。问题管理流程是事件管理流程的延展部分,用于处理大量重复发生的事件以及原因不明的事件,要求独立使用资源进行解决,并根据中国XX南方基地 IDC 现实运维情况排程实施问题的解决方案。该流程包含下述主要内容: 32 32 33 33 ★问题的生成和记录 34 34 35 -这个环节是问题管理流程的起点。此步骤的目的是为了能够在中国 移动南方基地 IDC 运维事件中发现具有隐患或风险的环节,以协助问题管理人员通知相应厂商或第三方公司进行解决,在此步骤中将会收集重复发生的事件或原因不明的事件的记录信息。35 +这个环节是问题管理流程的起点。此步骤的目的是为了能够在中国XX南方基地 IDC 运维事件中发现具有隐患或风险的环节,以协助问题管理人员通知相应厂商或第三方公司进行解决,在此步骤中将会收集重复发生的事件或原因不明的事件的记录信息。 36 36 37 37 该环节的关键是事件记录的准确性和完整性。 38 38 39 39 ★问题的分类与支持 40 40 41 -问题可以是来自中国 移动南方基地 IDC 业务环节中的任何一个部分,对每个问题都需要进行分类与分级,并区分来自业务逻辑的问题与来自业务系统的问题。对于没有找到解决方案的问题,需要自动累计关联的事件用以提高问题的严重程度,同时将问题分配给合适的厂商或第三方公司进行调查。41 +问题可以是来自中国XX南方基地 IDC 业务环节中的任何一个部分,对每个问题都需要进行分类与分级,并区分来自业务逻辑的问题与来自业务系统的问题。对于没有找到解决方案的问题,需要自动累计关联的事件用以提高问题的严重程度,同时将问题分配给合适的厂商或第三方公司进行调查。 42 42 43 43 ★问题的诊断和调查 44 44 45 -问题常常会表现为具体的技术难题,中国 移动南方基地运维团队须支持并协助相关厂商或第三方公司寻求解决方案。45 +问题常常会表现为具体的技术难题,中国XX南方基地运维团队须支持并协助相关厂商或第三方公司寻求解决方案。 46 46 47 47 ★问题的解决与回顾 48 48 ... ... @@ -59,7 +59,7 @@ 59 59 当最终确认问题被解决后,可结束该问题。 60 60 61 61 62 -=== **3 与其他流程的关系** === 62 +=== **3. 与其他流程的关系** === 63 63 64 64 ★和事件管理流程的关系 65 65 ... ... @@ -76,6 +76,7 @@ 76 76 77 77 === **4. 问题管理服务组织架构概述** === 78 78 79 + 79 79 ===== **4.1.问题经理** ===== 80 80 81 81 问题经理从总体上对问题管理流程的设计、实施、执行及优化负责,确保问题管理流程被正确的执行。当流程不能够适应运维实际情况时,问题经理必须及时对此进行分析,找出原因,加以改进,从而实现持续提高。 ... ... @@ -98,6 +98,9 @@ 98 98 99 99 9) 确保所有相关人员都足够程度地引入到问题管理的流程中,定期度量问题管理流程执行情况和团队绩效,召开问题管理会议,改进问题管理流程。 100 100 102 +(% class="wikigeneratedid" %) 103 +===== ===== 104 + 101 101 ===== **4.2.问题专家(团队)** ===== 102 102 103 103 1) 接受问题负责人分派的问题; ... ... @@ -116,6 +116,9 @@ 116 116 117 117 8) 整理常见或典型的问题记录,提交知识申请。 118 118 123 +(% class="wikigeneratedid" %) 124 +===== ===== 125 + 119 119 ===== **4.3.问题分析员** ===== 120 120 121 121 1) 主动分析,发现和识别问题,并填写问题记录; ... ... @@ -133,9 +133,10 @@ 133 133 134 134 === **5. 流程执行原则** === 135 135 143 + 136 136 ===== **5.1.常规原则** ===== 137 137 138 -★中国 移动南方基地 IDC 业务范围内发生的问题,都应该记录在 IT 服务管理平台中,记录的信息应足够详细,包括与其他流程的关联、问题处理交互过程,详细的解决方案和相应的附件、相应的资产信息。146 +★中国XX南方基地 IDC 业务范围内发生的问题,都应该记录在 IT 服务管理平台中,记录的信息应足够详细,包括与其他流程的关联、问题处理交互过程,详细的解决方案和相应的附件、相应的资产信息。 139 139 140 140 ★ 应鼓励事件管理流程相关人员主动提出问题,增加问题的来源渠道,问题分析员应按照专业领域对接收到的问题申请认真分析和识别,进行初步筛选; 141 141 ... ... @@ -151,6 +151,9 @@ 151 151 152 152 ★半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进问题管理流程。 153 153 162 +(% class="wikigeneratedid" %) 163 +===== ===== 164 + 154 154 ===== **5.2.流程关联原则** ===== 155 155 156 156 ★和事件管理的关联 ... ... @@ -171,13 +171,19 @@ 171 171 * 问题管理流程中须能够关联与产生问题相关的 IT 资源的配置数据。 172 172 * 所有问题的解决方案都必须在配置管理流程中记录。 173 173 185 +(% class="wikigeneratedid" %) 186 +===== ===== 187 + 174 174 ===== **5.3.所有权原则** ===== 175 175 176 176 所有权原则用来确保每个问题都能有适当的人员在进行解决方案的分析与验证。 177 177 178 178 * 问题分析员负责问题的发起与审核,并对问题单负责,并且辅助问题专家进行信息搜集及分析; 179 -* 193 +* 问题经理负责对整个问题的监督工作; 180 180 195 +(% class="wikigeneratedid" %) 196 +===== ===== 197 + 181 181 ===== **5.4.关闭原则** ===== 182 182 183 183 * 问题处理人员在解决方案分析与验证过程中,必须提供备用的应急处理方法供事件处理使用。 ... ... @@ -187,8 +187,12 @@ 187 187 * 在解决方案验证后可将问题关闭。 188 188 * 在问题关闭后,如再次出现相应事件,则须重新打开问题继续验证解决方案的正确性 189 189 207 +(% class="wikigeneratedid" %) 208 +=== === 209 + 190 190 === **6. 流程相关定义** === 191 191 212 + 192 192 ===== **6.1.问题信息项** ===== 193 193 194 194 问题单必须包含如下图表 2 问题信息项: ... ... @@ -286,10 +286,12 @@ 286 286 287 287 7) 问题状态,系统自动成为“新建”; 288 288 310 + 289 289 **6.4.2 查询知识库** 290 290 291 291 问题经理或问题分析员发现问题后,查询知识库确认此问题是否已有解决方案。如果有解决方案,转到(1.2.3)解决问题,否则转到(1.2.4)创建问题单。 292 292 315 + 293 293 **6.4.3 应用解决方案** 294 294 295 295 问题分析员或问题经理在找到问题解决方案后,要尽快实施解决方案,解决 ... ... @@ -308,6 +308,7 @@ 308 308 309 309 5) 问题状态(已解决); 310 310 334 + 311 311 **6.4.4 创建问题单** 312 312 313 313 问题分析员或问题经理根据问题具体情况,填写问题单。问题经理判断是否能够构成一个问题,如果构成问题,则转入(1.3)问题分类和分派,否则关闭问题。具体信息包括: ... ... @@ -322,6 +322,7 @@ 322 322 323 323 5) 问题状态(新建或已分派); 324 324 349 + 325 325 **6.4.5 注明原因后关闭问题** 326 326 327 327 问题经理认为不能构成一个问题,或者没有价值、资源来进行问题处理的,则注明原因后关闭问题。具体信息包括: ... ... @@ -330,6 +330,9 @@ 330 330 331 331 2) 问题状态(已取消); 332 332 358 +(% class="wikigeneratedid" %) 359 +===== ===== 360 + 333 333 ===== **6.5.问题分类和分派** ===== 334 334 335 335 问题分类和分派过程是问题经理接受和安排相应的问题处理组以进行处理的过程,参见流程图表 1-3 问题分类和分派流程图。 ... ... @@ -351,6 +351,7 @@ 351 351 352 352 5) 关联 CI; 353 353 382 + 354 354 **6.5.2 判断严重等级与分类** 355 355 356 356 问题的优先级是问题分析员解决问题的参照标准,对于关键优先级的问题,问题经理应该优先协调资源进行这些问题的解决。问题的优先级定义如下图表 5 ... ... @@ -380,6 +380,7 @@ 380 380 381 381 4) 问题状态(新建)。 382 382 412 + 383 383 **6.5.3 进行关联** 384 384 385 385 问题经理判断此问题是否与其他问题相关,如果相关,则进行问题关联,并且更新问题相关信息。需要记录信息包括: ... ... @@ -388,6 +388,7 @@ 388 388 389 389 2) 关联问题编号。 390 390 421 + 391 391 **6.5.4 分派问题** 392 392 393 393 问题经理根据设置的问题分类和优先级,协调合适的问题专家(团队)进行处理,并进行派单。为降低问题派单后被退单以及派单后问题专家未能及时获得派单信息(如在开会或不在座位),建议: ... ... @@ -406,6 +406,7 @@ 406 406 407 407 4) 问题的状态; 408 408 440 + 409 409 **6.5.5 接受分配** 410 410 411 411 问题专家(团队)接受到派单后,应立即着手对问题进行调查和分析。 ... ... @@ -424,6 +424,9 @@ 424 424 425 425 3) 问题状态(已分派); 426 426 459 +(% class="wikigeneratedid" %) 460 +===== ===== 461 + 427 427 ===== **6.6.问题调查与诊断** ===== 428 428 429 429 问题调查和诊断过程是问题专家(团队),对问题进行分析和诊断的过程,参见下图 1-4 问题调查与诊断流程图 ... ... @@ -435,10 +435,12 @@ 435 435 436 436 问题专家接受到派单后,应立即着手对问题进行调查和分析,提供问题解决方案、方法。 437 437 473 + 438 438 **6.6.2 确认问题根源** 439 439 440 440 问题专家对问题进行分析和诊断,找出可能的原因列表。如果不能找到问题根源,则转入(1.3.4)问题经理重新分派问题。 441 441 478 + 442 442 **6.6.3 记录问题根源** 443 443 444 444 问题专家对确认的问题的原因进行记录,判断此问题是否是已知问题。如果是已知问题,则进行已知问题关联,否则转入(1.5.)问题解决。 ... ... @@ -459,6 +459,9 @@ 459 459 460 460 2) 关联已知问题编号; 461 461 499 +(% class="wikigeneratedid" %) 500 +===== ===== 501 + 462 462 ===== **6.7.问题解决** ===== 463 463 464 464 根据问题分析的根本原因,提供问题解决方案或变通措施,参见图表 1-5 问题解决流程图 ... ... @@ -474,6 +474,7 @@ 474 474 475 475 2) 问题状态(处理中)。 476 476 517 + 477 477 **6.7.2 发起变更流程解决问题** 478 478 479 479 问题专家分析问题的解决办法,判断实施解决方案是否对生产系统产生影响。如果对生产系统有影响,则转入变更管理进行变更请求与解决。 ... ... @@ -486,10 +486,12 @@ 486 486 487 487 3) 问题状态(等待); 488 488 530 + 489 489 **6.7.3 尝试解决** 490 490 491 491 如果已有的解决方案不能解决现有问题,问题专家就要尝试解决问题。如果问题专家认为可以解决,则转入(1.5.2)开始解决问题,否则转入(1.5.3)问题经理重新分配问题。 492 492 535 + 493 493 **6.7.4 解决问题** 494 494 495 495 问题专家制定完成问题解决方案后,开始实施问题解决方案。问题解决后,按(1.6)关闭事件。 ... ... @@ -506,6 +506,7 @@ 506 506 507 507 5) 事件状态(已解决); 508 508 552 + 509 509 **6.7.5 重新分配** 510 510 511 511 对于问题专家不能解决的问题,问题经理要重新分配。 ... ... @@ -514,6 +514,9 @@ 514 514 515 515 如果问题经理判断没必要解决此问题,则转入(1.6.2)填写关闭代码。 516 516 561 +(% class="wikigeneratedid" %) 562 +===== ===== 563 + 517 517 ===== **6.8.问题关闭** ===== 518 518 519 519 问题关闭过程是问题得到解决后,应该遵循问题关闭的具体过程,下图是问题关闭的流程图 ... ... @@ -529,6 +529,7 @@ 529 529 530 530 如果问题是通过变通方法解决,问题分析员判断是否接受,否则重新分配问题。 531 531 579 + 532 532 **6.8.2 填写关闭代码** 533 533 534 534 问题关闭代码如下表所示: ... ... @@ -543,6 +543,7 @@ 543 543 544 544 3) 问题关闭状态; 545 545 594 + 546 546 **6.8.3 关闭工单** 547 547 548 548 关闭后的问题即为“已知错误”,在问题被关闭的同时将问题以及相应的解决方案应用到事件管理流程当中。 ... ... @@ -553,6 +553,9 @@ 553 553 554 554 2) 问题关闭状态(已关闭)。 555 555 605 +(% class="wikigeneratedid" %) 606 +===== ===== 607 + 556 556 ===== **6.9.问题监视** ===== 557 557 558 558 问题在创建后,问题经理应对对这些问题的状态进行监视,如下图所示: ... ... @@ -564,6 +564,7 @@ 564 564 565 565 **问题经理负责定期确认和跟踪问题的处理状态。** 566 566 619 + 567 567 **6.9.2 发送提醒** 568 568 569 569 问题管理流程中,具体问题处理一般不对解决时限作严格的时间要求。但为保证问题得到必要的重视,问题经理将根据问题的优先级别,通过短信/Email方式定期提醒问题分析员。