从版本< 7.1 >
由superadmin编辑
在2021/12/16, 23:03上
到版本
由superadmin编辑
在2022/01/15, 13:01上
< >
修改评论 该版本没有评论

Summary

Details

Icon Page properties
标题
... ... @@ -1,1 +1,1 @@
1 -ITIL 4事件管理实践中文版
1 +02 事件管理实践
Content
... ... @@ -39,8 +39,6 @@
39 39  * 支持实践的信息和技术
40 40  * 对实践的合作伙伴和供应商的考虑。
41 41  
42 -
43 -
44 44  == **1.1 ITIL®4 认证方案** ==
45 45  
46 46  本文档的部分内容可以作为以下教学大纲的一部分以供检查:
... ... @@ -58,7 +58,7 @@
58 58  = **2 一般信息** =
59 59  
60 60  
61 -== 2.1 **目的和描述** ==
59 +== **2.1** **目的和描述** ==
62 62  
63 63  |(((
64 64  **关键信息**
... ... @@ -70,7 +70,6 @@
70 70  事件管理实践是服务管理的基本元素。服务的快速恢复是用户和客户满意、服务提供者的信誉,以及组织在服务关系中创建价值的关键因素。
71 71  
72 72  
73 -
74 74  == **​​​​​​​2.2** **术语和概念** ==
75 75  
76 76  |**事件**
... ... @@ -103,7 +103,6 @@
103 103  * 与用户,客户,监管机构,媒体和其他利益相关者进行沟通的机制
104 104  * 达成一致的评审与后续活动的规程。
105 105  
106 -
107 107  |(((
108 108  **定义:变通方案**
109 109  )))
... ... @@ -119,8 +119,6 @@
119 119  )))
120 120  |因选择变通方案而非系统性解决方案(需要花费更长时间),而累计的返工总量
121 121  
122 -
123 -
124 124  == **​​​​​​​2.3 范围** ==
125 125  
126 126  事件管理实践的范围包括:
... ... @@ -157,8 +157,6 @@
157 157  |服务请求的管理和执行|服务请求管理
158 158  |灾难情况下,恢复正常操作|服务连续性管理
159 159  
160 -
161 -
162 162  == **​​​​​​​2.4** **实践成功因素** ==
163 163  
164 164  |(((
... ... @@ -174,8 +174,6 @@
174 174  * 快速有效地解决事件
175 175  * 不断改进事件管理方法。
176 176  
177 -
178 -
179 179  === **2.4.1 尽早发现事件** ===
180 180  
181 181  以前,实践通常是根据最终用户和IT专家的信息来报告大多数事件的。这种获取信息的方法仍被广泛使用,但是现在一个好的实践建议是自动发现和报告事件。可以在事件发生后和开始影响用户之前立即被发现。这种方法具有多种好处,其中包括:
... ... @@ -201,7 +201,6 @@
201 201  * 在复杂的情况下,事件的确切性质未知,但支持团队熟悉系统和组件,并且组织可以获取专家知识,因此通常会将事件分派到一个或多个专家组进行诊断和解决。有时,这可以帮助识别模式,并产生一个模型和/或解决方案,可以应用于未来的类似事件。
202 202  * 在非常复杂的情况下,很难或不可能确定专家区域和专家组,或者已确定的专家组找不到解决方案时,采用集体方法可能会有用。此技术称为“全功能团队”。
203 203  
204 -
205 205  |**全功能团队**
206 206  |解决各种复杂任务的技术方法。在全功能团队中,具有不同专业知识领域的多个人员一起完成一项任务,直到明确哪些能力最相关和最需要。
207 207  
... ... @@ -221,8 +221,6 @@
221 221  * 找到并纠正根本原因的能力
222 222  * 机器学习的可能性和质量。
223 223  
224 -
225 -
226 226  ==== **2.4.2.1 事件的优先级** ====
227 227  
228 228  事件应尽快解决。但是,参与事件解决的团队的资源是有限的,并且这些团队通常同时参与其他类型的工作。应该优先处理某些事件,以最大程度地减少对用户的负面影响。
... ... @@ -261,8 +261,6 @@
261 261  全面描述采取行动的原因与描述行动本身同样重要。
262 262  )))
263 263  
264 -(% class="wikigeneratedid" %)
265 -
266 266  == **​​​​​​​2.5 关键指标** ==
267 267  
268 268  应该基于每个实践对价值流的贡献来评估ITIL实践的有效性和绩效。与任何工具的绩效一样,实践的绩效只能在其应用情境中评估。工具在设计和质量上可能会有很大差异,按照工具的用途使用时,这些差异定义了工具有效性的潜力或能力。关于度量标准,关键绩效指标(KPI)和其它技术的进一步指导,请参见度量和报告实践指南。
... ... @@ -307,8 +307,6 @@
307 307  事件解决的速度和有效性指标之间的平衡
308 308  )))
309 309  
310 -
311 -
312 312  ----
313 313  
314 314  = **3 价值流和流程** =
... ... @@ -334,7 +334,7 @@
334 334  图3.1 事件管理实践对价值链活动的贡献热力图
335 335  
336 336  
337 -== **​​​​​​​3.2 流程** ==
320 +== **3.2 流程** ==
338 338  
339 339  每个实践可以包含一个或多个过程和活动,这是实现这一实践目的所必需的。
340 340  
... ... @@ -349,8 +349,6 @@
349 349  * **事件的处理和解决**。该流程的重点是从发现到关闭的单个事件的处理和解决。
350 350  * **定期事件评审**。该流程确保从事件处理和解决的过程中吸取教训,并确保持续改进事件管理的方法。
351 351  
352 -
353 -
354 354  === **3.2.1 事件处理和解决** ===
355 355  
356 356  该过程包括表3.1中列出的活动,并将输入转换为输出。
... ... @@ -387,47 +387,11 @@
387 387  
388 388  表3.2 事件处理和事件解决过程的活动
389 389  
390 -(% style="width:1010px" %)
391 -|(% style="width:85px" %)**活动**|(% style="width:439px" %)**手动处理用户发现的事件**|(% style="width:484px" %)**自动发现和处理事件**
392 -|(% style="width:85px" %)事件发现|(% style="width:439px" %)用户发现服务运营中的故障,并通过约定的渠道与服务提供者的服务台联系。服务台客服对该用户问询进行初始分类,确认该问询确实属于事件。|(% style="width:484px" %)监控系统检测到事态,并基于预定义的分类将其标识为事件。
393 -|(% style="width:85px" %)事件登记|(% style="width:439px" %)服务台客服执行事件登记,将有效数据添加到事件记录中。|(% style="width:484px" %)登记事件记录并将其与发现事态的CI关联。登记预定义的技术参数。必要时,给相关技术专家发送通知。
394 -|(% style="width:85px" %)事件分类|(% style="width:439px" %)(((
395 -服务台客服完成事件初始分类;这有助于确定事件的影响,确定为失效CI和/或服务确定责任团队,并将事件关联到其他过去和正在处理的事态,事件和/或问题。
371 +[[image:1642222461983-817.png]]
396 396  
397 -在某些情况下,分类有助于找到以前为此类事件定义的解决方案。
398 -)))|(% style="width:484px" %)(((
399 -根据预定义的规则,将自动发现:
373 +[[image:1642222484248-277.png]]
400 400  
401 -* 事件对服务和用户的影响
402 -* 可用的解决方案
403 -* 如果自动化解决方案无效或不可用,找到负责事件解决的技术团队。
404 -)))
405 -|(% style="width:85px" %)事件诊断|(% style="width:439px" %)(((
406 -如果分类没有关联到已知解决方案,
407 407  
408 -专家团队开展事件诊断。这可能涉及将事件升级到不同团队,或其他联合技术团队加入(如全功能团队)。
409 -
410 -如果由于配置项关联错误而导致分类错误,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。
411 -)))|(% style="width:484px" %)(((
412 -如果自动解决方案无效或不可用,则将事件上报给负责诊断的技术团队。可能涉及事件升级到不同团队,或其他技术团队加入(如全功能团队)。
413 -
414 -如果由于配置项关联错误而导致自动化解决方案失败,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。
415 -)))
416 -|(% style="width:85px" %)事件解决|(% style="width:439px" %)找到解决方案后,相关专家团队将尝试按顺序或并行工作方式执行,这可能需要启动变更。如果解决方案不起作用,则再次诊断。|(% style="width:484px" %)如果有可用的自动化解决方案,则实施它,并完成测试和确认。如果需要手动干预,则相关的专业团队尝试实施,这可能需要启动变更。如果解决方案不起作用,则再次诊断。
417 -|(% style="width:85px" %)事件关闭|(% style="width:439px" %)(((
418 -成功解决事件之后,可能需要一些正式的关闭过程:
419 -
420 -* 用户确认服务恢复
421 -* 计算解决方案成本并报告
422 -* 解决方案结算报价和发票
423 -* 问题调查启动
424 -* 事件评审
425 -
426 -完成所有必需的操作并更新了相应地事件记录后,事件正式关闭。这可以由产品负责人,服务负责人,事件经理或服务台客服完成,具体取决于商定的事件模型。
427 -)))|(% style="width:484px" %)如果自动解决方案证明有效,则事件记录将自动更新并关闭。发送报告给负责的技术团队。如果在先前的任何步骤中已将有关事件的信息传达给其他利益相关者,则应向其传达事件关闭的信息。
428 -
429 -
430 -
431 431  === **3.2.2 定期事件评审** ===
432 432  
433 433  该流程的重点是持续改进事件管理实践,事件模型和事件处理程序。它可以定期执行,也可以由事件报告触发,该报告突显低效率和其他改进点机会。根据现有模型和程序的效果,每两到三个月或更短时间进行一次定期检查。
... ... @@ -500,8 +500,6 @@
500 500  |М|**方法和技巧专家 **设计和实施技术、文件化步骤、流程咨询、工作分析和持续改进
501 501  |Т|**技术专家**提供技术(IT)专业知识并执行基于专家经验的作业
502 502  
503 -
504 -
505 505  === **4.1.1 事件经理角色** ===
506 506  
507 507  在许多组织中,事件经理角色由专人担任,有时授予事件经理的职衔。在其他组织中,事件经理的责任由负责与事件关联的配置项,服务或产品的人员或团队承担;他可能是资源所有者,服务负责人或产品负责人。
... ... @@ -528,102 +528,11 @@
528 528  
529 529  表4.2负责事件管理活动的角色示例
530 530  
531 -|**实现价值**|**负责角色**|**能力简介**|**具体技能**
532 -|(% colspan="4" %)**事件处理和解决流程**
533 -|事件发现|(((
534 -技术专家
474 +[[image:1642222648578-782.png]]
535 535  
536 -用户
537 -)))|TC|理解服务设计,资源配置和业务影响,了解事态的特征
538 -|事件登记|(((
539 -事件经理
476 +[[image:1642222669993-827.png]]
540 540  
541 -服务台客服
542 542  
543 -技术专家
544 -)))|AT|熟练掌握IT服务管理(ITSM)工具和程序
545 -|事件分类|(((
546 -事件经理
547 -
548 -服务台客服
549 -
550 -技术专家
551 -)))|TC|(((
552 -理解服务设计,资源配置和业务影响
553 -
554 -熟悉事件解决的要求和承诺
555 -
556 -熟悉事件模型
557 -)))
558 -|事件诊断|(((
559 -供应商
560 -
561 -技术专家
562 -)))|TC|(((
563 -理解服务设计,资源配置和业务影响
564 -
565 -具备事件模型、诊断工具、诊断方法的知识
566 -
567 -分析能力
568 -)))
569 -|事件解决|(((
570 -供应商
571 -
572 -技术专家用户
573 -)))|T|了解事件解决的方法和程序要求
574 -|事件关闭|(((
575 -事件经理
576 -
577 -服务台客服
578 -
579 -技术专家
580 -)))|ACT|(((
581 -理解服务设计,资源配置和业务影响
582 -
583 -熟悉事件解决的要求和承诺
584 -)))
585 -|(% colspan="4" %)**定期事件评审流程**
586 -|事件评审和事件记录分析|(((
587 -事件经理
588 -
589 -产品负责人
590 -
591 -服务负责人
592 -
593 -供应商
594 -)))|TCL|(((
595 -理解服务设计,资源配置和业务影响
596 -
597 -熟悉事件解决的要求和承诺
598 -
599 -具备事件模型、诊断工具,诊断方法的知识和分析能力
600 -)))
601 -|事件模型优化的启动|(((
602 -事件经理
603 -
604 -产品负责人
605 -
606 -服务负责人
607 -)))|TMC|(((
608 -理解服务设计,资源配置和业务影响
609 -
610 -熟悉事件解决的要求和承诺
611 -
612 -具备事件模型、诊断工具,诊断方法的知识
613 -
614 -熟悉组织的持续改进和变更管理实践
615 -)))
616 -|事件模型变更的沟通|(((
617 -事件经理
618 -
619 -产品负责人
620 -
621 -服务台客服
622 -
623 -服务负责人
624 -)))|CA|熟悉沟通程序和沟通工具
625 -
626 -
627 627  == **​​​​​​​4.2** **组织结构和团队** ==
628 628  
629 629  事件管理实践不推荐任何特定的组织模型。但是,组织结构会影响实践的执行方式,因为它涉及具有不同领域和专业水平的专家。专家分组的典型方法包括:
... ... @@ -653,7 +653,6 @@
653 653  * L3团队间协作,以取代多次重新分配和/或对专家和顶级人才的过度依赖。
654 654  )))
655 655  
656 -
657 657  === **4.2.2 团队动力** ===
658 658  
659 659  事件管理实践是团队动力的基础,它们影响着运维支持团队的职责履行。经常出现以下问题:
... ... @@ -725,20 +725,9 @@
725 725  
726 726  表5.1 事件记录中包含的数据
727 727  
728 -|**域**|**推荐内容**|**说明**
729 -|事件标题(简短说明)|观察到的降低或失效的功能或过程|带有清晰说明的解决方案搜索速度更快
730 -|用户|受影响的用户,被报告的用户|
731 -|当前影响|对用户/客户工作流程的实际影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法
732 -|未来影响|如果事件持续下去,对客户的潜在影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法
733 -|首次症状的时间|监控或用户体验中的日期和时间|诊断原因之前的准确时间点
734 -|最近一次正常状态的时间|验证功能正常的日期和时间|触发事态的准确时间点(此信息是人为添加还是自动记录的,可能会影响可信度)
735 -|受影响项目(功能,配置项,流程)的详细信息|资产ID号,应用程序和流程名称以及配置项索引|集中精力进行修复
736 -|未受影响的可比项目(如果有)的详细信息|未受影响的资产ID号,应用程序和流程名称以及配置项索引|缩小搜索范围
737 -|诊断详情(如果有)|诊断步骤和每步的结果|减少重复工作
738 -|分派|事件的个人或团队所有者|
579 +[[image:1642222734298-342.png]]
739 739  
740 740  
741 -
742 742  == **​​​​​​​5.2** **自动化和工具** ==
743 743  
744 744  事件管理实践应该是自动化的。在可行且有效的情况下,可能涉及表5.2中概述的解决方案。
... ... @@ -750,50 +750,12 @@
750 750  
751 751  表5.2 事件管理活动的自动化解决方案
752 752  
753 -|**过程活动**|**自动化方式**|**关键功能**|**对实践有效性的影响**
754 -|(% colspan="4" %)**事件处理和解决流程**
755 -|事件发现|监控工具和事态相关引擎|早期的检测和事件关联,初始化事件管理实践|高
756 -|事件登记|用户查询管理和工作流程工具,以及协同工具|有效记录事件|高
757 -|事件分类|(((
758 -用户查询管理和工作流程工具,
593 +[[image:1642222873598-155.png]]
759 759  
760 -协同工具,
595 +[[image:1642222893312-806.png]]
761 761  
762 -知识管理工具,
763 763  
764 -配置管理工具
765 765  
766 -和基于机器学习的分类引擎
767 -)))|快速、准确的分类和事件分派,已知解决方案的识别,重大事件的识别|非常高,尤其是在事件数量多的情况下
768 -|事件诊断|(((
769 -分析和诊断工具
770 -
771 -知识管理工具
772 -
773 -配置管理工具
774 -
775 -协同工具
776 -)))|快速、准确的定义和测试假设,多个专家/团队的有效协作|高,特别是在需要手动协作的复杂事件数量很多时
777 -|事件解决|(((
778 -远程管理工具
779 -
780 -自动化的部署系统,
781 -
782 -和协同工具
783 -)))|快速纠正失效的配置项并恢复服务|高,特别是提供远程服务时
784 -|事件关闭|用户查询和工作流管理工具,和协同工具|快速而全面的回顾事件生命周期|中
785 -|**定期事件评审流程**| | |
786 -|事件评审和事件记录分析|协同系统,分析和报告系统以及调查工具|(((
787 -远程协作,事件数据分析和用户调查数据
788 -
789 -分析和报告
790 -)))|中到高,尤其是对批量事件
791 -|事件模型优化的启动|工作流系统和待办项管理工具|优化的正式登记|低到中
792 -|事件模型更新的沟通|通信系统和协作系统|与受影响团队沟通更新|中到高,尤其当组织较大,更新较多时为高
793 -
794 -
795 -
796 -
797 797  ----
798 798  
799 799  = **6 合作伙伴和供应商** =
... ... @@ -823,8 +823,6 @@
823 823  * 保持简单实用
824 824  * 优化和自动化。
825 825  
826 -
827 -
828 828  ----
829 829  
830 830  = **8 致谢** =
Icon 1642222461983-817.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +117.4 KB
Content Icon
Icon 1642222484248-277.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +68.3 KB
Content Icon
Icon 1642222648578-782.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +62.3 KB
Content Icon
Icon 1642222669993-827.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +46.5 KB
Content Icon
Icon 1642222734298-342.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +84.0 KB
Content Icon
Icon 1642222873598-155.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +72.6 KB
Content Icon
Icon 1642222893312-806.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.superadmin
Size
... ... @@ -1,0 +1,1 @@
1 +29.3 KB
Content Icon
深圳市艾拓先锋企业管理咨询有限公司