From version < 20.1 >
edited by superadmin
on 2022/01/15, 13:01
To version < 27.1 >
edited by superadmin
on 2024/05/12, 00:06
< >
Change comment: There is no comment for this version

Summary

Details

Icon Page properties
Title
... ... @@ -1,1 +1,1 @@
1 -02 事件管理实践
1 +服务管理实践 - 02 事件
Content
... ... @@ -1,8 +1,11 @@
1 +{{info}}
2 +===== **了解长河老师 ¥599元  ITIL4基础级认证核心考点讲解和习题辅导,请点击 [[ITIL 4 基础认证必考知识速学网课>>https://www.itil4hub.cn/bin/view/ITIL4%E8%AE%A4%E8%AF%81%E5%9F%B9%E8%AE%AD%E8%80%83%E8%AF%95%E8%B5%84%E6%96%99/ITIL4%E5%9F%BA%E7%A1%80%E8%AE%A4%E8%AF%81%E5%BF%85%E8%80%83%E7%9F%A5%E8%AF%86%E9%80%9F%E5%AD%A6%E7%BD%91%E8%AF%BE/]]** =====
3 +{{/info}}
4 +
5 +
1 1  **申明:**
2 2  
3 -本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众
4 -多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信
5 -公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。
8 +本系列ITIL 4中文版本由长河领导的ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与。需要下载最新翻译版本请关注微信公众号:**ITILXF**,并回复“**事件管理**”或“**事件**”即可。
6 6  
7 7  
8 8  请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。
... ... @@ -131,11 +131,12 @@
131 131  
132 132  表2.1 其他实践中描述的与事件管理实践相关的活动
133 133  
134 -|**活动**|**实践指南**
135 -|调查事件原因|问题管理
136 -|与用户沟通|服务台
137 -|实施产品和服务的变更|变更支持
138 -| |(((
137 +(% style="width:364px" %)
138 +|(% style="width:204px" %)**活动**|(% style="width:157px" %)**实践指南**
139 +|(% style="width:204px" %)调查事件原因|(% style="width:157px" %)问题管理
140 +|(% style="width:204px" %)与用户沟通|(% style="width:157px" %)服务台
141 +|(% style="width:204px" %)实施产品和服务的变更|(% style="width:157px" %)变更支持
142 +|(% style="width:204px" %) |(% style="width:157px" %)(((
139 139  部署管理
140 140  
141 141  基础设施和平台管理
... ... @@ -146,10 +146,10 @@
146 146  
147 147  软件开发和管理
148 148  )))
149 -|监控技术,团队和供应商绩效|监控和事态管理
150 -|改进计划的管理|持续改进
151 -|服务请求的管理和执行|服务请求管理
152 -|灾难情况下,恢复正常操作|服务连续性管理
153 +|(% style="width:204px" %)监控技术,团队和供应商绩效|(% style="width:157px" %)监控和事态管理
154 +|(% style="width:204px" %)改进计划的管理|(% style="width:157px" %)持续改进
155 +|(% style="width:204px" %)服务请求的管理和执行|(% style="width:157px" %)服务请求管理
156 +|(% style="width:204px" %)灾难情况下,恢复正常操作|(% style="width:157px" %)服务连续性管理
153 153  
154 154  == **​​​​​​​2.4** **实践成功因素** ==
155 155  
... ... @@ -259,13 +259,14 @@
259 259  
260 260  表2.2 实践成功因素的关键指标示例
261 261  
262 -|**实践成功因素**|**指标示例**
263 -|尽早发现事件|(((
266 +(% style="width:458px" %)
267 +|(% style="width:182px" %)**实践成功因素**|(% style="width:273px" %)**指标示例**
268 +|(% style="width:182px" %)尽早发现事件|(% style="width:273px" %)(((
264 264  事件发生到发现之间的时间
265 265  
266 266  通过监控和事态管理发现的事件百分比
267 267  )))
268 -|快速有效地解决事件|(((
273 +|(% style="width:182px" %)快速有效地解决事件|(% style="width:273px" %)(((
269 269  从事件发现到接受诊断之间的时间
270 270  
271 271  派单次数
... ... @@ -282,7 +282,7 @@
282 282  
283 283  用户报告之前已解决的事件的百分比
284 284  )))
285 -|不断改进事件管理方法|(((
290 +|(% style="width:182px" %)不断改进事件管理方法|(% style="width:273px" %)(((
286 286  使用先前确定和记录的解决方案的事件解决率
287 287  
288 288  使用事件模型解决的事件的百分比
... ... @@ -368,45 +368,11 @@
368 368  
369 369  表3.2 事件处理和事件解决过程的活动
370 370  
371 -(% style="width:889px" %)
372 -|(% style="width:85px" %)**活动**|(% style="width:399px" %)**手动处理用户发现的事件**|(% style="width:403px" %)**自动发现和处理事件**
373 -|(% style="width:85px" %)事件发现|(% style="width:399px" %)用户发现服务运营中的故障,并通过约定的渠道与服务提供者的服务台联系。服务台客服对该用户问询进行初始分类,确认该问询确实属于事件。|(% style="width:403px" %)监控系统检测到事态,并基于预定义的分类将其标识为事件。
374 -|(% style="width:85px" %)事件登记|(% style="width:399px" %)服务台客服执行事件登记,将有效数据添加到事件记录中。|(% style="width:403px" %)登记事件记录并将其与发现事态的CI关联。登记预定义的技术参数。必要时,给相关技术专家发送通知。
375 -|(% style="width:85px" %)事件分类|(% style="width:399px" %)(((
376 -服务台客服完成事件初始分类;这有助于确定事件的影响,确定为失效CI和/或服务确定责任团队,并将事件关联到其他过去和正在处理的事态,事件和/或问题。
376 +[[image:1642222461983-817.png]]
377 377  
378 -在某些情况下,分类有助于找到以前为此类事件定义的解决方案。
379 -)))|(% style="width:403px" %)(((
380 -根据预定义的规则,将自动发现:
378 +[[image:1642222484248-277.png]]
381 381  
382 -* 事件对服务和用户的影响
383 -* 可用的解决方案
384 -* 如果自动化解决方案无效或不可用,找到负责事件解决的技术团队。
385 -)))
386 -|(% style="width:85px" %)事件诊断|(% style="width:399px" %)(((
387 -如果分类没有关联到已知解决方案,
388 388  
389 -专家团队开展事件诊断。这可能涉及将事件升级到不同团队,或其他联合技术团队加入(如全功能团队)。
390 -
391 -如果由于配置项关联错误而导致分类错误,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。
392 -)))|(% style="width:403px" %)(((
393 -如果自动解决方案无效或不可用,则将事件上报给负责诊断的技术团队。可能涉及事件升级到不同团队,或其他技术团队加入(如全功能团队)。
394 -
395 -如果由于配置项关联错误而导致自动化解决方案失败,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。
396 -)))
397 -|(% style="width:85px" %)事件解决|(% style="width:399px" %)找到解决方案后,相关专家团队将尝试按顺序或并行工作方式执行,这可能需要启动变更。如果解决方案不起作用,则再次诊断。|(% style="width:403px" %)如果有可用的自动化解决方案,则实施它,并完成测试和确认。如果需要手动干预,则相关的专业团队尝试实施,这可能需要启动变更。如果解决方案不起作用,则再次诊断。
398 -|(% style="width:85px" %)事件关闭|(% style="width:399px" %)(((
399 -成功解决事件之后,可能需要一些正式的关闭过程:
400 -
401 -* 用户确认服务恢复
402 -* 计算解决方案成本并报告
403 -* 解决方案结算报价和发票
404 -* 问题调查启动
405 -* 事件评审
406 -
407 -完成所有必需的操作并更新了相应地事件记录后,事件正式关闭。这可以由产品负责人,服务负责人,事件经理或服务台客服完成,具体取决于商定的事件模型。
408 -)))|(% style="width:403px" %)如果自动解决方案证明有效,则事件记录将自动更新并关闭。发送报告给负责的技术团队。如果在先前的任何步骤中已将有关事件的信息传达给其他利益相关者,则应向其传达事件关闭的信息。
409 -
410 410  === **3.2.2 定期事件评审** ===
411 411  
412 412  该流程的重点是持续改进事件管理实践,事件模型和事件处理程序。它可以定期执行,也可以由事件报告触发,该报告突显低效率和其他改进点机会。根据现有模型和程序的效果,每两到三个月或更短时间进行一次定期检查。
... ... @@ -416,22 +416,22 @@
416 416  
417 417  表3.3定期事件评审的输入、输出和活动
418 418  
419 -(% style="width:738px" %)
420 -|(% style="width:297px" %)**关键输入**|(% style="width:233px" %)**活动**|(% style="width:207px" %)**关键输出**
421 -|(% style="width:297px" %)当前事件的模型和程序|(% style="width:233px" %)事件评审和事件记录分析|(% style="width:207px" %)更新的事件模型
422 -|(% style="width:297px" %)事件记录|(% style="width:233px" %)事件模型优化的启动|(% style="width:207px" %)更新的事件处理程序
423 -|(% style="width:297px" %)事件报告|(% style="width:233px" %) |(% style="width:207px" %)事件记录
424 -|(% style="width:297px" %)策略和法规要求|(% style="width:233px" %)事件模型更新的沟通|(% style="width:207px" %)更新的事件模型和过程的沟通
425 -|(% style="width:297px" %)配置信息|(% style="width:233px" %) |(% style="width:207px" %)
426 -|(% style="width:297px" %)IT资产信息|(% style="width:233px" %) |(% style="width:207px" %)变更请求
427 -|(% style="width:297px" %)与消费者和供应商/合作伙伴的SLA|(% style="width:233px" %) |(% style="width:207px" %)(((
390 +(% style="width:406px" %)
391 +|(% style="width:139px" %)**关键输入**|(% style="width:146px" %)**活动**|(% style="width:117px" %)**关键输出**
392 +|(% style="width:139px" %)当前事件的模型和程序|(% style="width:146px" %)事件评审和事件记录分析|(% style="width:117px" %)更新的事件模型
393 +|(% style="width:139px" %)事件记录|(% style="width:146px" %)事件模型优化的启动|(% style="width:117px" %)更新的事件处理程序
394 +|(% style="width:139px" %)事件报告|(% style="width:146px" %) |(% style="width:117px" %)事件记录
395 +|(% style="width:139px" %)策略和法规要求|(% style="width:146px" %)事件模型更新的沟通|(% style="width:117px" %)更新的事件模型和过程的沟通
396 +|(% style="width:139px" %)配置信息|(% style="width:146px" %) |(% style="width:117px" %)
397 +|(% style="width:139px" %)IT资产信息|(% style="width:146px" %) |(% style="width:117px" %)变更请求
398 +|(% style="width:139px" %)与消费者和供应商/合作伙伴的SLA|(% style="width:146px" %) |(% style="width:117px" %)(((
428 428  改进计划
429 429  
430 430  事件评审报告
431 431  )))
432 -|(% style="width:297px" %)容量和性能信息|(% style="width:233px" %) |(% style="width:207px" %)
433 -|(% style="width:297px" %)连续性策略和计划|(% style="width:233px" %) |(% style="width:207px" %)
434 -|(% style="width:297px" %)安全策略和计划|(% style="width:233px" %) |(% style="width:207px" %)
403 +|(% style="width:139px" %)容量和性能信息|(% style="width:146px" %) |(% style="width:117px" %)
404 +|(% style="width:139px" %)连续性策略和计划|(% style="width:146px" %) |(% style="width:117px" %)
405 +|(% style="width:139px" %)安全策略和计划|(% style="width:146px" %) |(% style="width:117px" %)
435 435  
436 436  图3.3 展示事件评审的工作流程图。
437 437  
... ... @@ -447,14 +447,15 @@
447 447  
448 448  表3.4 定期事件评审流程的活动
449 449  
450 -|**活动**|**示例**
451 -|事件评审和事件记录分析|事件经理与服务所有者和其他相关的利益相关者一起,对选定的事件(例如重大事件,未及时解决的事件或特定时期内的所有事件)实施评审,确定事件模型和事件处理程序的改进机会,包括事件处理和解决方案的自动化。
452 -|事件模型优化的启动|事件经理记录优化方案,它将通过持续改进实践或启动变更请求开始。(如果事件模型、程序和自动化包含在变更支持实践的范围内)。
453 -|(((
421 +(% style="width:434px" %)
422 +|(% style="width:106px" %)**活动**|(% style="width:326px" %)**示例**
423 +|(% style="width:106px" %)事件评审和事件记录分析|(% style="width:326px" %)事件经理与服务所有者和其他相关的利益相关者一起,对选定的事件(例如重大事件,未及时解决的事件或特定时期内的所有事件)实施评审,确定事件模型和事件处理程序的改进机会,包括事件处理和解决方案的自动化。
424 +|(% style="width:106px" %)事件模型优化的启动|(% style="width:326px" %)事件经理记录优化方案,它将通过持续改进实践或启动变更请求开始。(如果事件模型、程序和自动化包含在变更支持实践的范围内)。
425 +|(% style="width:106px" %)(((
454 454  事件模型
455 455  
456 456  变更的沟通
457 -)))|如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。
429 +)))|(% style="width:326px" %)如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。
458 458  
459 459  ----
460 460  
... ... @@ -503,101 +503,11 @@
503 503  
504 504  表4.2负责事件管理活动的角色示例
505 505  
506 -|**实现价值**|**负责角色**|**能力简介**|**具体技能**
507 -|(% colspan="4" %)**事件处理和解决流程**
508 -|事件发现|(((
509 -技术专家
478 +[[image:1642222648578-782.png]]
510 510  
511 -用户
512 -)))|TC|理解服务设计,资源配置和业务影响,了解事态的特征
513 -|事件登记|(((
514 -事件经理
480 +[[image:1642222669993-827.png]]
515 515  
516 -服务台客服
517 517  
518 -技术专家
519 -)))|AT|熟练掌握IT服务管理(ITSM)工具和程序
520 -|事件分类|(((
521 -事件经理
522 -
523 -服务台客服
524 -
525 -技术专家
526 -)))|TC|(((
527 -理解服务设计,资源配置和业务影响
528 -
529 -熟悉事件解决的要求和承诺
530 -
531 -熟悉事件模型
532 -)))
533 -|事件诊断|(((
534 -供应商
535 -
536 -技术专家
537 -)))|TC|(((
538 -理解服务设计,资源配置和业务影响
539 -
540 -具备事件模型、诊断工具、诊断方法的知识
541 -
542 -分析能力
543 -)))
544 -|事件解决|(((
545 -供应商
546 -
547 -技术专家用户
548 -)))|T|了解事件解决的方法和程序要求
549 -|事件关闭|(((
550 -事件经理
551 -
552 -服务台客服
553 -
554 -技术专家
555 -)))|ACT|(((
556 -理解服务设计,资源配置和业务影响
557 -
558 -熟悉事件解决的要求和承诺
559 -)))
560 -|(% colspan="4" %)**定期事件评审流程**
561 -|事件评审和事件记录分析|(((
562 -事件经理
563 -
564 -产品负责人
565 -
566 -服务负责人
567 -
568 -供应商
569 -)))|TCL|(((
570 -理解服务设计,资源配置和业务影响
571 -
572 -熟悉事件解决的要求和承诺
573 -
574 -具备事件模型、诊断工具,诊断方法的知识和分析能力
575 -)))
576 -|事件模型优化的启动|(((
577 -事件经理
578 -
579 -产品负责人
580 -
581 -服务负责人
582 -)))|TMC|(((
583 -理解服务设计,资源配置和业务影响
584 -
585 -熟悉事件解决的要求和承诺
586 -
587 -具备事件模型、诊断工具,诊断方法的知识
588 -
589 -熟悉组织的持续改进和变更管理实践
590 -)))
591 -|事件模型变更的沟通|(((
592 -事件经理
593 -
594 -产品负责人
595 -
596 -服务台客服
597 -
598 -服务负责人
599 -)))|CA|熟悉沟通程序和沟通工具
600 -
601 601  == **​​​​​​​4.2** **组织结构和团队** ==
602 602  
603 603  事件管理实践不推荐任何特定的组织模型。但是,组织结构会影响实践的执行方式,因为它涉及具有不同领域和专业水平的专家。专家分组的典型方法包括:
... ... @@ -698,18 +698,9 @@
698 698  
699 699  表5.1 事件记录中包含的数据
700 700  
701 -|**域**|**推荐内容**|**说明**
702 -|事件标题(简短说明)|观察到的降低或失效的功能或过程|带有清晰说明的解决方案搜索速度更快
703 -|用户|受影响的用户,被报告的用户|
704 -|当前影响|对用户/客户工作流程的实际影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法
705 -|未来影响|如果事件持续下去,对客户的潜在影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法
706 -|首次症状的时间|监控或用户体验中的日期和时间|诊断原因之前的准确时间点
707 -|最近一次正常状态的时间|验证功能正常的日期和时间|触发事态的准确时间点(此信息是人为添加还是自动记录的,可能会影响可信度)
708 -|受影响项目(功能,配置项,流程)的详细信息|资产ID号,应用程序和流程名称以及配置项索引|集中精力进行修复
709 -|未受影响的可比项目(如果有)的详细信息|未受影响的资产ID号,应用程序和流程名称以及配置项索引|缩小搜索范围
710 -|诊断详情(如果有)|诊断步骤和每步的结果|减少重复工作
711 -|分派|事件的个人或团队所有者|
583 +[[image:1642222734298-342.png]]
712 712  
585 +
713 713  == **​​​​​​​5.2** **自动化和工具** ==
714 714  
715 715  事件管理实践应该是自动化的。在可行且有效的情况下,可能涉及表5.2中概述的解决方案。
... ... @@ -721,47 +721,12 @@
721 721  
722 722  表5.2 事件管理活动的自动化解决方案
723 723  
724 -|**过程活动**|**自动化方式**|**关键功能**|**对实践有效性的影响**
725 -|(% colspan="4" %)**事件处理和解决流程**
726 -|事件发现|监控工具和事态相关引擎|早期的检测和事件关联,初始化事件管理实践|高
727 -|事件登记|用户查询管理和工作流程工具,以及协同工具|有效记录事件|高
728 -|事件分类|(((
729 -用户查询管理和工作流程工具,
597 +[[image:1642222873598-155.png]]
730 730  
731 -协同工具,
599 +[[image:1642222893312-806.png]]
732 732  
733 -知识管理工具,
734 734  
735 -配置管理工具
736 736  
737 -和基于机器学习的分类引擎
738 -)))|快速、准确的分类和事件分派,已知解决方案的识别,重大事件的识别|非常高,尤其是在事件数量多的情况下
739 -|事件诊断|(((
740 -分析和诊断工具
741 -
742 -知识管理工具
743 -
744 -配置管理工具
745 -
746 -协同工具
747 -)))|快速、准确的定义和测试假设,多个专家/团队的有效协作|高,特别是在需要手动协作的复杂事件数量很多时
748 -|事件解决|(((
749 -远程管理工具
750 -
751 -自动化的部署系统,
752 -
753 -和协同工具
754 -)))|快速纠正失效的配置项并恢复服务|高,特别是提供远程服务时
755 -|事件关闭|用户查询和工作流管理工具,和协同工具|快速而全面的回顾事件生命周期|中
756 -|**定期事件评审流程**| | |
757 -|事件评审和事件记录分析|协同系统,分析和报告系统以及调查工具|(((
758 -远程协作,事件数据分析和用户调查数据
759 -
760 -分析和报告
761 -)))|中到高,尤其是对批量事件
762 -|事件模型优化的启动|工作流系统和待办项管理工具|优化的正式登记|低到中
763 -|事件模型更新的沟通|通信系统和协作系统|与受影响团队沟通更新|中到高,尤其当组织较大,更新较多时为高
764 -
765 765  ----
766 766  
767 767  = **6 合作伙伴和供应商** =
... ... @@ -808,5 +808,3 @@
808 808  == **8.2 审稿人** ==
809 809  
810 810  Akshay Anand, Sofi Fahlberg, Michael G. Hall, Steve Harrop, Piia Karvonen, Anton Lykov, Paula Määttänen, Christian F. Nissen, Mark O’Loughlin, Tatiana Orlova, Elina Pirjanti, Stuart Rance.
811 -
812 -
深圳市艾拓先锋企业管理咨询有限公司