Changes for page 服务管理实践 - 02 事件
Last modified by superadmin on 2024/12/25, 15:38
Summary
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 - 02事件管理实践1 +ITIL 4事件管理实践中文版 - Content
-
... ... @@ -39,6 +39,8 @@ 39 39 * 支持实践的信息和技术 40 40 * 对实践的合作伙伴和供应商的考虑。 41 41 42 + 43 + 42 42 == **1.1 ITIL®4 认证方案** == 43 43 44 44 本文档的部分内容可以作为以下教学大纲的一部分以供检查: ... ... @@ -56,7 +56,7 @@ 56 56 = **2 一般信息** = 57 57 58 58 59 -== **2.1****目的和描述** ==61 +== 2.1 **目的和描述** == 60 60 61 61 |((( 62 62 **关键信息** ... ... @@ -68,6 +68,7 @@ 68 68 事件管理实践是服务管理的基本元素。服务的快速恢复是用户和客户满意、服务提供者的信誉,以及组织在服务关系中创建价值的关键因素。 69 69 70 70 73 + 71 71 == **2.2** **术语和概念** == 72 72 73 73 |**事件** ... ... @@ -100,6 +100,7 @@ 100 100 * 与用户,客户,监管机构,媒体和其他利益相关者进行沟通的机制 101 101 * 达成一致的评审与后续活动的规程。 102 102 106 + 103 103 |((( 104 104 **定义:变通方案** 105 105 ))) ... ... @@ -115,6 +115,8 @@ 115 115 ))) 116 116 |因选择变通方案而非系统性解决方案(需要花费更长时间),而累计的返工总量 117 117 122 + 123 + 118 118 == **2.3 范围** == 119 119 120 120 事件管理实践的范围包括: ... ... @@ -151,6 +151,8 @@ 151 151 |服务请求的管理和执行|服务请求管理 152 152 |灾难情况下,恢复正常操作|服务连续性管理 153 153 160 + 161 + 154 154 == **2.4** **实践成功因素** == 155 155 156 156 |((( ... ... @@ -166,6 +166,8 @@ 166 166 * 快速有效地解决事件 167 167 * 不断改进事件管理方法。 168 168 177 + 178 + 169 169 === **2.4.1 尽早发现事件** === 170 170 171 171 以前,实践通常是根据最终用户和IT专家的信息来报告大多数事件的。这种获取信息的方法仍被广泛使用,但是现在一个好的实践建议是自动发现和报告事件。可以在事件发生后和开始影响用户之前立即被发现。这种方法具有多种好处,其中包括: ... ... @@ -191,6 +191,7 @@ 191 191 * 在复杂的情况下,事件的确切性质未知,但支持团队熟悉系统和组件,并且组织可以获取专家知识,因此通常会将事件分派到一个或多个专家组进行诊断和解决。有时,这可以帮助识别模式,并产生一个模型和/或解决方案,可以应用于未来的类似事件。 192 192 * 在非常复杂的情况下,很难或不可能确定专家区域和专家组,或者已确定的专家组找不到解决方案时,采用集体方法可能会有用。此技术称为“全功能团队”。 193 193 204 + 194 194 |**全功能团队** 195 195 |解决各种复杂任务的技术方法。在全功能团队中,具有不同专业知识领域的多个人员一起完成一项任务,直到明确哪些能力最相关和最需要。 196 196 ... ... @@ -210,6 +210,8 @@ 210 210 * 找到并纠正根本原因的能力 211 211 * 机器学习的可能性和质量。 212 212 224 + 225 + 213 213 ==== **2.4.2.1 事件的优先级** ==== 214 214 215 215 事件应尽快解决。但是,参与事件解决的团队的资源是有限的,并且这些团队通常同时参与其他类型的工作。应该优先处理某些事件,以最大程度地减少对用户的负面影响。 ... ... @@ -248,6 +248,8 @@ 248 248 全面描述采取行动的原因与描述行动本身同样重要。 249 249 ))) 250 250 264 +(% class="wikigeneratedid" %) 265 + 251 251 == **2.5 关键指标** == 252 252 253 253 应该基于每个实践对价值流的贡献来评估ITIL实践的有效性和绩效。与任何工具的绩效一样,实践的绩效只能在其应用情境中评估。工具在设计和质量上可能会有很大差异,按照工具的用途使用时,这些差异定义了工具有效性的潜力或能力。关于度量标准,关键绩效指标(KPI)和其它技术的进一步指导,请参见度量和报告实践指南。 ... ... @@ -292,6 +292,8 @@ 292 292 事件解决的速度和有效性指标之间的平衡 293 293 ))) 294 294 310 + 311 + 295 295 ---- 296 296 297 297 = **3 价值流和流程** = ... ... @@ -317,7 +317,7 @@ 317 317 图3.1 事件管理实践对价值链活动的贡献热力图 318 318 319 319 320 -== **3.2 流程** == 337 +== **3.2 流程** == 321 321 322 322 每个实践可以包含一个或多个过程和活动,这是实现这一实践目的所必需的。 323 323 ... ... @@ -332,6 +332,8 @@ 332 332 * **事件的处理和解决**。该流程的重点是从发现到关闭的单个事件的处理和解决。 333 333 * **定期事件评审**。该流程确保从事件处理和解决的过程中吸取教训,并确保持续改进事件管理的方法。 334 334 352 + 353 + 335 335 === **3.2.1 事件处理和解决** === 336 336 337 337 该过程包括表3.1中列出的活动,并将输入转换为输出。 ... ... @@ -368,11 +368,47 @@ 368 368 369 369 表3.2 事件处理和事件解决过程的活动 370 370 371 -[[image:1642222461983-817.png]] 390 +(% style="width:1010px" %) 391 +|(% style="width:85px" %)**活动**|(% style="width:439px" %)**手动处理用户发现的事件**|(% style="width:484px" %)**自动发现和处理事件** 392 +|(% style="width:85px" %)事件发现|(% style="width:439px" %)用户发现服务运营中的故障,并通过约定的渠道与服务提供者的服务台联系。服务台客服对该用户问询进行初始分类,确认该问询确实属于事件。|(% style="width:484px" %)监控系统检测到事态,并基于预定义的分类将其标识为事件。 393 +|(% style="width:85px" %)事件登记|(% style="width:439px" %)服务台客服执行事件登记,将有效数据添加到事件记录中。|(% style="width:484px" %)登记事件记录并将其与发现事态的CI关联。登记预定义的技术参数。必要时,给相关技术专家发送通知。 394 +|(% style="width:85px" %)事件分类|(% style="width:439px" %)((( 395 +服务台客服完成事件初始分类;这有助于确定事件的影响,确定为失效CI和/或服务确定责任团队,并将事件关联到其他过去和正在处理的事态,事件和/或问题。 372 372 373 -[[image:1642222484248-277.png]] 397 +在某些情况下,分类有助于找到以前为此类事件定义的解决方案。 398 +)))|(% style="width:484px" %)((( 399 +根据预定义的规则,将自动发现: 374 374 401 +* 事件对服务和用户的影响 402 +* 可用的解决方案 403 +* 如果自动化解决方案无效或不可用,找到负责事件解决的技术团队。 404 +))) 405 +|(% style="width:85px" %)事件诊断|(% style="width:439px" %)((( 406 +如果分类没有关联到已知解决方案, 375 375 408 +专家团队开展事件诊断。这可能涉及将事件升级到不同团队,或其他联合技术团队加入(如全功能团队)。 409 + 410 +如果由于配置项关联错误而导致分类错误,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 411 +)))|(% style="width:484px" %)((( 412 +如果自动解决方案无效或不可用,则将事件上报给负责诊断的技术团队。可能涉及事件升级到不同团队,或其他技术团队加入(如全功能团队)。 413 + 414 +如果由于配置项关联错误而导致自动化解决方案失败,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 415 +))) 416 +|(% style="width:85px" %)事件解决|(% style="width:439px" %)找到解决方案后,相关专家团队将尝试按顺序或并行工作方式执行,这可能需要启动变更。如果解决方案不起作用,则再次诊断。|(% style="width:484px" %)如果有可用的自动化解决方案,则实施它,并完成测试和确认。如果需要手动干预,则相关的专业团队尝试实施,这可能需要启动变更。如果解决方案不起作用,则再次诊断。 417 +|(% style="width:85px" %)事件关闭|(% style="width:439px" %)((( 418 +成功解决事件之后,可能需要一些正式的关闭过程: 419 + 420 +* 用户确认服务恢复 421 +* 计算解决方案成本并报告 422 +* 解决方案结算报价和发票 423 +* 问题调查启动 424 +* 事件评审 425 + 426 +完成所有必需的操作并更新了相应地事件记录后,事件正式关闭。这可以由产品负责人,服务负责人,事件经理或服务台客服完成,具体取决于商定的事件模型。 427 +)))|(% style="width:484px" %)如果自动解决方案证明有效,则事件记录将自动更新并关闭。发送报告给负责的技术团队。如果在先前的任何步骤中已将有关事件的信息传达给其他利益相关者,则应向其传达事件关闭的信息。 428 + 429 + 430 + 376 376 === **3.2.2 定期事件评审** === 377 377 378 378 该流程的重点是持续改进事件管理实践,事件模型和事件处理程序。它可以定期执行,也可以由事件报告触发,该报告突显低效率和其他改进点机会。根据现有模型和程序的效果,每两到三个月或更短时间进行一次定期检查。 ... ... @@ -445,6 +445,8 @@ 445 445 |М|**方法和技巧专家 **设计和实施技术、文件化步骤、流程咨询、工作分析和持续改进 446 446 |Т|**技术专家**提供技术(IT)专业知识并执行基于专家经验的作业 447 447 503 + 504 + 448 448 === **4.1.1 事件经理角色** === 449 449 450 450 在许多组织中,事件经理角色由专人担任,有时授予事件经理的职衔。在其他组织中,事件经理的责任由负责与事件关联的配置项,服务或产品的人员或团队承担;他可能是资源所有者,服务负责人或产品负责人。 ... ... @@ -471,11 +471,102 @@ 471 471 472 472 表4.2负责事件管理活动的角色示例 473 473 474 -[[image:1642222648578-782.png]] 531 +|**实现价值**|**负责角色**|**能力简介**|**具体技能** 532 +|(% colspan="4" %)**事件处理和解决流程** 533 +|事件发现|((( 534 +技术专家 475 475 476 -[[image:1642222669993-827.png]] 536 +用户 537 +)))|TC|理解服务设计,资源配置和业务影响,了解事态的特征 538 +|事件登记|((( 539 +事件经理 477 477 541 +服务台客服 478 478 543 +技术专家 544 +)))|AT|熟练掌握IT服务管理(ITSM)工具和程序 545 +|事件分类|((( 546 +事件经理 547 + 548 +服务台客服 549 + 550 +技术专家 551 +)))|TC|((( 552 +理解服务设计,资源配置和业务影响 553 + 554 +熟悉事件解决的要求和承诺 555 + 556 +熟悉事件模型 557 +))) 558 +|事件诊断|((( 559 +供应商 560 + 561 +技术专家 562 +)))|TC|((( 563 +理解服务设计,资源配置和业务影响 564 + 565 +具备事件模型、诊断工具、诊断方法的知识 566 + 567 +分析能力 568 +))) 569 +|事件解决|((( 570 +供应商 571 + 572 +技术专家用户 573 +)))|T|了解事件解决的方法和程序要求 574 +|事件关闭|((( 575 +事件经理 576 + 577 +服务台客服 578 + 579 +技术专家 580 +)))|ACT|((( 581 +理解服务设计,资源配置和业务影响 582 + 583 +熟悉事件解决的要求和承诺 584 +))) 585 +|(% colspan="4" %)**定期事件评审流程** 586 +|事件评审和事件记录分析|((( 587 +事件经理 588 + 589 +产品负责人 590 + 591 +服务负责人 592 + 593 +供应商 594 +)))|TCL|((( 595 +理解服务设计,资源配置和业务影响 596 + 597 +熟悉事件解决的要求和承诺 598 + 599 +具备事件模型、诊断工具,诊断方法的知识和分析能力 600 +))) 601 +|事件模型优化的启动|((( 602 +事件经理 603 + 604 +产品负责人 605 + 606 +服务负责人 607 +)))|TMC|((( 608 +理解服务设计,资源配置和业务影响 609 + 610 +熟悉事件解决的要求和承诺 611 + 612 +具备事件模型、诊断工具,诊断方法的知识 613 + 614 +熟悉组织的持续改进和变更管理实践 615 +))) 616 +|事件模型变更的沟通|((( 617 +事件经理 618 + 619 +产品负责人 620 + 621 +服务台客服 622 + 623 +服务负责人 624 +)))|CA|熟悉沟通程序和沟通工具 625 + 626 + 479 479 == **4.2** **组织结构和团队** == 480 480 481 481 事件管理实践不推荐任何特定的组织模型。但是,组织结构会影响实践的执行方式,因为它涉及具有不同领域和专业水平的专家。专家分组的典型方法包括: ... ... @@ -505,6 +505,7 @@ 505 505 * L3团队间协作,以取代多次重新分配和/或对专家和顶级人才的过度依赖。 506 506 ))) 507 507 656 + 508 508 === **4.2.2 团队动力** === 509 509 510 510 事件管理实践是团队动力的基础,它们影响着运维支持团队的职责履行。经常出现以下问题: ... ... @@ -576,9 +576,20 @@ 576 576 577 577 表5.1 事件记录中包含的数据 578 578 579 -[[image:1642222734298-342.png]] 728 +|**域**|**推荐内容**|**说明** 729 +|事件标题(简短说明)|观察到的降低或失效的功能或过程|带有清晰说明的解决方案搜索速度更快 730 +|用户|受影响的用户,被报告的用户| 731 +|当前影响|对用户/客户工作流程的实际影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 732 +|未来影响|如果事件持续下去,对客户的潜在影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 733 +|首次症状的时间|监控或用户体验中的日期和时间|诊断原因之前的准确时间点 734 +|最近一次正常状态的时间|验证功能正常的日期和时间|触发事态的准确时间点(此信息是人为添加还是自动记录的,可能会影响可信度) 735 +|受影响项目(功能,配置项,流程)的详细信息|资产ID号,应用程序和流程名称以及配置项索引|集中精力进行修复 736 +|未受影响的可比项目(如果有)的详细信息|未受影响的资产ID号,应用程序和流程名称以及配置项索引|缩小搜索范围 737 +|诊断详情(如果有)|诊断步骤和每步的结果|减少重复工作 738 +|分派|事件的个人或团队所有者| 580 580 581 581 741 + 582 582 == **5.2** **自动化和工具** == 583 583 584 584 事件管理实践应该是自动化的。在可行且有效的情况下,可能涉及表5.2中概述的解决方案。 ... ... @@ -590,12 +590,50 @@ 590 590 591 591 表5.2 事件管理活动的自动化解决方案 592 592 593 -[[image:1642222873598-155.png]] 753 +|**过程活动**|**自动化方式**|**关键功能**|**对实践有效性的影响** 754 +|(% colspan="4" %)**事件处理和解决流程** 755 +|事件发现|监控工具和事态相关引擎|早期的检测和事件关联,初始化事件管理实践|高 756 +|事件登记|用户查询管理和工作流程工具,以及协同工具|有效记录事件|高 757 +|事件分类|((( 758 +用户查询管理和工作流程工具, 594 594 595 - [[image:1642222893312-806.png]]760 +协同工具, 596 596 762 +知识管理工具, 597 597 764 +配置管理工具 598 598 766 +和基于机器学习的分类引擎 767 +)))|快速、准确的分类和事件分派,已知解决方案的识别,重大事件的识别|非常高,尤其是在事件数量多的情况下 768 +|事件诊断|((( 769 +分析和诊断工具 770 + 771 +知识管理工具 772 + 773 +配置管理工具 774 + 775 +协同工具 776 +)))|快速、准确的定义和测试假设,多个专家/团队的有效协作|高,特别是在需要手动协作的复杂事件数量很多时 777 +|事件解决|((( 778 +远程管理工具 779 + 780 +自动化的部署系统, 781 + 782 +和协同工具 783 +)))|快速纠正失效的配置项并恢复服务|高,特别是提供远程服务时 784 +|事件关闭|用户查询和工作流管理工具,和协同工具|快速而全面的回顾事件生命周期|中 785 +|**定期事件评审流程**| | | 786 +|事件评审和事件记录分析|协同系统,分析和报告系统以及调查工具|((( 787 +远程协作,事件数据分析和用户调查数据 788 + 789 +分析和报告 790 +)))|中到高,尤其是对批量事件 791 +|事件模型优化的启动|工作流系统和待办项管理工具|优化的正式登记|低到中 792 +|事件模型更新的沟通|通信系统和协作系统|与受影响团队沟通更新|中到高,尤其当组织较大,更新较多时为高 793 + 794 + 795 + 796 + 599 599 ---- 600 600 601 601 = **6 合作伙伴和供应商** = ... ... @@ -625,6 +625,8 @@ 625 625 * 保持简单实用 626 626 * 优化和自动化。 627 627 826 + 827 + 628 628 ---- 629 629 630 630 = **8 致谢** =
- 1642222461983-817.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -117.4 KB - Content
- 1642222484248-277.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -68.3 KB - Content
- 1642222648578-782.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -62.3 KB - Content
- 1642222669993-827.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -46.5 KB - Content
- 1642222734298-342.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -84.0 KB - Content
- 1642222873598-155.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -72.6 KB - Content
- 1642222893312-806.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -29.3 KB - Content