由 superadmin 于 2024/10/10, 21:02 最后修改
Summary
Details
- Page properties
-
- Content
-
... ... @@ -4,9 +4,9 @@ 4 4 = ** ITIL问题管理流程需求说明书** = 5 5 6 6 7 -=== **1 .流程目的** ===7 +=== **1 流程目的** === 8 8 9 -★问题管理流程的主要功能是消除或减少事件的发生,对于重复发生的事件以及原因不明的事件、以及工作中主动发现的问题须使用问题管理流程进行解决,保持中国 XX南方基地 IDC 业务支撑系统的健康性,其目的包括:9 +★问题管理流程的主要功能是消除或减少事件的发生,对于重复发生的事件以及原因不明的事件、以及工作中主动发现的问题须使用问题管理流程进行解决,保持中国移动南方基地 IDC 业务支撑系统的健康性,其目的包括: 10 10 11 11 * 在成本允许的范围内尽快降低关联事件的重复发生 12 12 * 关联重复发生的事件 ... ... @@ -28,21 +28,21 @@ 28 28 === **2. 流程主要内容** === 29 29 30 30 31 -问题(Problem)是导致事件产生的根源。问题管理流程是事件管理流程的延展部分,用于处理大量重复发生的事件以及原因不明的事件,要求独立使用资源进行解决,并根据中国 XX南方基地 IDC 现实运维情况排程实施问题的解决方案。该流程包含下述主要内容:31 +问题(Problem)是导致事件产生的根源。问题管理流程是事件管理流程的延展部分,用于处理大量重复发生的事件以及原因不明的事件,要求独立使用资源进行解决,并根据中国移动南方基地 IDC 现实运维情况排程实施问题的解决方案。该流程包含下述主要内容: 32 32 33 33 ★问题的生成和记录 34 34 35 -这个环节是问题管理流程的起点。此步骤的目的是为了能够在中国 XX南方基地 IDC 运维事件中发现具有隐患或风险的环节,以协助问题管理人员通知相应厂商或第三方公司进行解决,在此步骤中将会收集重复发生的事件或原因不明的事件的记录信息。35 +这个环节是问题管理流程的起点。此步骤的目的是为了能够在中国移动南方基地 IDC 运维事件中发现具有隐患或风险的环节,以协助问题管理人员通知相应厂商或第三方公司进行解决,在此步骤中将会收集重复发生的事件或原因不明的事件的记录信息。 36 36 37 37 该环节的关键是事件记录的准确性和完整性。 38 38 39 39 ★问题的分类与支持 40 40 41 -问题可以是来自中国 XX南方基地 IDC 业务环节中的任何一个部分,对每个问题都需要进行分类与分级,并区分来自业务逻辑的问题与来自业务系统的问题。对于没有找到解决方案的问题,需要自动累计关联的事件用以提高问题的严重程度,同时将问题分配给合适的厂商或第三方公司进行调查。41 +问题可以是来自中国移动南方基地 IDC 业务环节中的任何一个部分,对每个问题都需要进行分类与分级,并区分来自业务逻辑的问题与来自业务系统的问题。对于没有找到解决方案的问题,需要自动累计关联的事件用以提高问题的严重程度,同时将问题分配给合适的厂商或第三方公司进行调查。 42 42 43 43 ★问题的诊断和调查 44 44 45 -问题常常会表现为具体的技术难题,中国 XX南方基地运维团队须支持并协助相关厂商或第三方公司寻求解决方案。45 +问题常常会表现为具体的技术难题,中国移动南方基地运维团队须支持并协助相关厂商或第三方公司寻求解决方案。 46 46 47 47 ★问题的解决与回顾 48 48 ... ... @@ -59,7 +59,7 @@ 59 59 当最终确认问题被解决后,可结束该问题。 60 60 61 61 62 -=== **3 .与其他流程的关系** ===62 +=== **3 与其他流程的关系** === 63 63 64 64 ★和事件管理流程的关系 65 65 ... ... @@ -76,7 +76,6 @@ 76 76 77 77 === **4. 问题管理服务组织架构概述** === 78 78 79 - 80 80 ===== **4.1.问题经理** ===== 81 81 82 82 问题经理从总体上对问题管理流程的设计、实施、执行及优化负责,确保问题管理流程被正确的执行。当流程不能够适应运维实际情况时,问题经理必须及时对此进行分析,找出原因,加以改进,从而实现持续提高。 ... ... @@ -99,9 +99,6 @@ 99 99 100 100 9) 确保所有相关人员都足够程度地引入到问题管理的流程中,定期度量问题管理流程执行情况和团队绩效,召开问题管理会议,改进问题管理流程。 101 101 102 -(% class="wikigeneratedid" %) 103 -===== ===== 104 - 105 105 ===== **4.2.问题专家(团队)** ===== 106 106 107 107 1) 接受问题负责人分派的问题; ... ... @@ -120,9 +120,6 @@ 120 120 121 121 8) 整理常见或典型的问题记录,提交知识申请。 122 122 123 -(% class="wikigeneratedid" %) 124 -===== ===== 125 - 126 126 ===== **4.3.问题分析员** ===== 127 127 128 128 1) 主动分析,发现和识别问题,并填写问题记录; ... ... @@ -140,10 +140,9 @@ 140 140 141 141 === **5. 流程执行原则** === 142 142 143 - 144 144 ===== **5.1.常规原则** ===== 145 145 146 -★中国 XX南方基地 IDC 业务范围内发生的问题,都应该记录在 IT 服务管理平台中,记录的信息应足够详细,包括与其他流程的关联、问题处理交互过程,详细的解决方案和相应的附件、相应的资产信息。138 +★中国移动南方基地 IDC 业务范围内发生的问题,都应该记录在 IT 服务管理平台中,记录的信息应足够详细,包括与其他流程的关联、问题处理交互过程,详细的解决方案和相应的附件、相应的资产信息。 147 147 148 148 ★ 应鼓励事件管理流程相关人员主动提出问题,增加问题的来源渠道,问题分析员应按照专业领域对接收到的问题申请认真分析和识别,进行初步筛选; 149 149 ... ... @@ -159,9 +159,6 @@ 159 159 160 160 ★半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进问题管理流程。 161 161 162 -(% class="wikigeneratedid" %) 163 -===== ===== 164 - 165 165 ===== **5.2.流程关联原则** ===== 166 166 167 167 ★和事件管理的关联 ... ... @@ -182,19 +182,13 @@ 182 182 * 问题管理流程中须能够关联与产生问题相关的 IT 资源的配置数据。 183 183 * 所有问题的解决方案都必须在配置管理流程中记录。 184 184 185 -(% class="wikigeneratedid" %) 186 -===== ===== 187 - 188 188 ===== **5.3.所有权原则** ===== 189 189 190 190 所有权原则用来确保每个问题都能有适当的人员在进行解决方案的分析与验证。 191 191 192 192 * 问题分析员负责问题的发起与审核,并对问题单负责,并且辅助问题专家进行信息搜集及分析; 193 -* 问题经理负责对整个问题的监督工作; 179 +* 问题经理负责对整个问题的监督工作; 194 194 195 -(% class="wikigeneratedid" %) 196 -===== ===== 197 - 198 198 ===== **5.4.关闭原则** ===== 199 199 200 200 * 问题处理人员在解决方案分析与验证过程中,必须提供备用的应急处理方法供事件处理使用。 ... ... @@ -204,12 +204,8 @@ 204 204 * 在解决方案验证后可将问题关闭。 205 205 * 在问题关闭后,如再次出现相应事件,则须重新打开问题继续验证解决方案的正确性 206 206 207 -(% class="wikigeneratedid" %) 208 -=== === 209 - 210 210 === **6. 流程相关定义** === 211 211 212 - 213 213 ===== **6.1.问题信息项** ===== 214 214 215 215 问题单必须包含如下图表 2 问题信息项: ... ... @@ -307,12 +307,10 @@ 307 307 308 308 7) 问题状态,系统自动成为“新建”; 309 309 310 - 311 311 **6.4.2 查询知识库** 312 312 313 313 问题经理或问题分析员发现问题后,查询知识库确认此问题是否已有解决方案。如果有解决方案,转到(1.2.3)解决问题,否则转到(1.2.4)创建问题单。 314 314 315 - 316 316 **6.4.3 应用解决方案** 317 317 318 318 问题分析员或问题经理在找到问题解决方案后,要尽快实施解决方案,解决 ... ... @@ -331,7 +331,6 @@ 331 331 332 332 5) 问题状态(已解决); 333 333 334 - 335 335 **6.4.4 创建问题单** 336 336 337 337 问题分析员或问题经理根据问题具体情况,填写问题单。问题经理判断是否能够构成一个问题,如果构成问题,则转入(1.3)问题分类和分派,否则关闭问题。具体信息包括: ... ... @@ -346,7 +346,6 @@ 346 346 347 347 5) 问题状态(新建或已分派); 348 348 349 - 350 350 **6.4.5 注明原因后关闭问题** 351 351 352 352 问题经理认为不能构成一个问题,或者没有价值、资源来进行问题处理的,则注明原因后关闭问题。具体信息包括: ... ... @@ -355,9 +355,6 @@ 355 355 356 356 2) 问题状态(已取消); 357 357 358 -(% class="wikigeneratedid" %) 359 -===== ===== 360 - 361 361 ===== **6.5.问题分类和分派** ===== 362 362 363 363 问题分类和分派过程是问题经理接受和安排相应的问题处理组以进行处理的过程,参见流程图表 1-3 问题分类和分派流程图。 ... ... @@ -379,7 +379,6 @@ 379 379 380 380 5) 关联 CI; 381 381 382 - 383 383 **6.5.2 判断严重等级与分类** 384 384 385 385 问题的优先级是问题分析员解决问题的参照标准,对于关键优先级的问题,问题经理应该优先协调资源进行这些问题的解决。问题的优先级定义如下图表 5 ... ... @@ -409,7 +409,6 @@ 409 409 410 410 4) 问题状态(新建)。 411 411 412 - 413 413 **6.5.3 进行关联** 414 414 415 415 问题经理判断此问题是否与其他问题相关,如果相关,则进行问题关联,并且更新问题相关信息。需要记录信息包括: ... ... @@ -418,7 +418,6 @@ 418 418 419 419 2) 关联问题编号。 420 420 421 - 422 422 **6.5.4 分派问题** 423 423 424 424 问题经理根据设置的问题分类和优先级,协调合适的问题专家(团队)进行处理,并进行派单。为降低问题派单后被退单以及派单后问题专家未能及时获得派单信息(如在开会或不在座位),建议: ... ... @@ -437,7 +437,6 @@ 437 437 438 438 4) 问题的状态; 439 439 440 - 441 441 **6.5.5 接受分配** 442 442 443 443 问题专家(团队)接受到派单后,应立即着手对问题进行调查和分析。 ... ... @@ -456,9 +456,6 @@ 456 456 457 457 3) 问题状态(已分派); 458 458 459 -(% class="wikigeneratedid" %) 460 -===== ===== 461 - 462 462 ===== **6.6.问题调查与诊断** ===== 463 463 464 464 问题调查和诊断过程是问题专家(团队),对问题进行分析和诊断的过程,参见下图 1-4 问题调查与诊断流程图 ... ... @@ -470,12 +470,10 @@ 470 470 471 471 问题专家接受到派单后,应立即着手对问题进行调查和分析,提供问题解决方案、方法。 472 472 473 - 474 474 **6.6.2 确认问题根源** 475 475 476 476 问题专家对问题进行分析和诊断,找出可能的原因列表。如果不能找到问题根源,则转入(1.3.4)问题经理重新分派问题。 477 477 478 - 479 479 **6.6.3 记录问题根源** 480 480 481 481 问题专家对确认的问题的原因进行记录,判断此问题是否是已知问题。如果是已知问题,则进行已知问题关联,否则转入(1.5.)问题解决。 ... ... @@ -496,9 +496,6 @@ 496 496 497 497 2) 关联已知问题编号; 498 498 499 -(% class="wikigeneratedid" %) 500 -===== ===== 501 - 502 502 ===== **6.7.问题解决** ===== 503 503 504 504 根据问题分析的根本原因,提供问题解决方案或变通措施,参见图表 1-5 问题解决流程图 ... ... @@ -514,7 +514,6 @@ 514 514 515 515 2) 问题状态(处理中)。 516 516 517 - 518 518 **6.7.2 发起变更流程解决问题** 519 519 520 520 问题专家分析问题的解决办法,判断实施解决方案是否对生产系统产生影响。如果对生产系统有影响,则转入变更管理进行变更请求与解决。 ... ... @@ -527,12 +527,10 @@ 527 527 528 528 3) 问题状态(等待); 529 529 530 - 531 531 **6.7.3 尝试解决** 532 532 533 533 如果已有的解决方案不能解决现有问题,问题专家就要尝试解决问题。如果问题专家认为可以解决,则转入(1.5.2)开始解决问题,否则转入(1.5.3)问题经理重新分配问题。 534 534 535 - 536 536 **6.7.4 解决问题** 537 537 538 538 问题专家制定完成问题解决方案后,开始实施问题解决方案。问题解决后,按(1.6)关闭事件。 ... ... @@ -549,7 +549,6 @@ 549 549 550 550 5) 事件状态(已解决); 551 551 552 - 553 553 **6.7.5 重新分配** 554 554 555 555 对于问题专家不能解决的问题,问题经理要重新分配。 ... ... @@ -558,9 +558,6 @@ 558 558 559 559 如果问题经理判断没必要解决此问题,则转入(1.6.2)填写关闭代码。 560 560 561 -(% class="wikigeneratedid" %) 562 -===== ===== 563 - 564 564 ===== **6.8.问题关闭** ===== 565 565 566 566 问题关闭过程是问题得到解决后,应该遵循问题关闭的具体过程,下图是问题关闭的流程图 ... ... @@ -576,7 +576,6 @@ 576 576 577 577 如果问题是通过变通方法解决,问题分析员判断是否接受,否则重新分配问题。 578 578 579 - 580 580 **6.8.2 填写关闭代码** 581 581 582 582 问题关闭代码如下表所示: ... ... @@ -591,7 +591,6 @@ 591 591 592 592 3) 问题关闭状态; 593 593 594 - 595 595 **6.8.3 关闭工单** 596 596 597 597 关闭后的问题即为“已知错误”,在问题被关闭的同时将问题以及相应的解决方案应用到事件管理流程当中。 ... ... @@ -602,9 +602,6 @@ 602 602 603 603 2) 问题关闭状态(已关闭)。 604 604 605 -(% class="wikigeneratedid" %) 606 -===== ===== 607 - 608 608 ===== **6.9.问题监视** ===== 609 609 610 610 问题在创建后,问题经理应对对这些问题的状态进行监视,如下图所示: ... ... @@ -616,7 +616,6 @@ 616 616 617 617 **问题经理负责定期确认和跟踪问题的处理状态。** 618 618 619 - 620 620 **6.9.2 发送提醒** 621 621 622 622 问题管理流程中,具体问题处理一般不对解决时限作严格的时间要求。但为保证问题得到必要的重视,问题经理将根据问题的优先级别,通过短信/Email方式定期提醒问题分析员。