文档更改服务管理实践 - 02 事件
由 superadmin 于 2024/12/25, 15:38 最后修改
修改评论
该版本没有评论
Summary
Details
- Page properties
-
- 标题
-
... ... @@ -1,1 +1,1 @@ 1 - 02事件管理实践1 +ITIL 4事件管理实践中文版 - 父
-
... ... @@ -1,1 +1,1 @@ 1 - 00 服务管理实践.WebHome1 +Main.WebHome - Content
-
... ... @@ -1,9 +4,8 @@ 1 -如有[[ITIL认证>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]、[[ITIL培训>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]或[[ITIL考试>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]]需求,可[[点击了解详情>>url:http://www.itilchina.cn/achotsao/vip_doc/13354653.html]] 2 - 3 - 4 4 **申明:** 5 5 6 -本系列ITIL 4中文版本由长河领导的ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与。需要下载最新翻译版本请关注微信公众号:**ITILXF**,并回复“**事件管理**”或“**事件**”即可。 3 +本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众 4 +多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信 5 +公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。 7 7 8 8 9 9 请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。 ... ... @@ -68,7 +68,6 @@ 68 68 69 69 事件管理实践是服务管理的基本元素。服务的快速恢复是用户和客户满意、服务提供者的信誉,以及组织在服务关系中创建价值的关键因素。 70 70 71 - 72 72 == **2.2** **术语和概念** == 73 73 74 74 |**事件** ... ... @@ -132,12 +132,11 @@ 132 132 133 133 表2.1 其他实践中描述的与事件管理实践相关的活动 134 134 135 -(% style="width:364px" %) 136 -|(% style="width:204px" %)**活动**|(% style="width:157px" %)**实践指南** 137 -|(% style="width:204px" %)调查事件原因|(% style="width:157px" %)问题管理 138 -|(% style="width:204px" %)与用户沟通|(% style="width:157px" %)服务台 139 -|(% style="width:204px" %)实施产品和服务的变更|(% style="width:157px" %)变更支持 140 -|(% style="width:204px" %) |(% style="width:157px" %)((( 133 +|**活动**|**实践指南** 134 +|调查事件原因|问题管理 135 +|与用户沟通|服务台 136 +|实施产品和服务的变更|变更支持 137 +| |((( 141 141 部署管理 142 142 143 143 基础设施和平台管理 ... ... @@ -148,10 +148,10 @@ 148 148 149 149 软件开发和管理 150 150 ))) 151 -| (% style="width:204px" %)监控技术,团队和供应商绩效|(% style="width:157px" %)监控和事态管理152 -| (% style="width:204px" %)改进计划的管理|(% style="width:157px" %)持续改进153 -| (% style="width:204px" %)服务请求的管理和执行|(% style="width:157px" %)服务请求管理154 -| (% style="width:204px" %)灾难情况下,恢复正常操作|(% style="width:157px" %)服务连续性管理148 +|监控技术,团队和供应商绩效|监控和事态管理 149 +|改进计划的管理|持续改进 150 +|服务请求的管理和执行|服务请求管理 151 +|灾难情况下,恢复正常操作|服务连续性管理 155 155 156 156 == **2.4** **实践成功因素** == 157 157 ... ... @@ -250,6 +250,10 @@ 250 250 全面描述采取行动的原因与描述行动本身同样重要。 251 251 ))) 252 252 250 +(% class="wikigeneratedid" %) 251 + 252 + 253 + 253 253 == **2.5 关键指标** == 254 254 255 255 应该基于每个实践对价值流的贡献来评估ITIL实践的有效性和绩效。与任何工具的绩效一样,实践的绩效只能在其应用情境中评估。工具在设计和质量上可能会有很大差异,按照工具的用途使用时,这些差异定义了工具有效性的潜力或能力。关于度量标准,关键绩效指标(KPI)和其它技术的进一步指导,请参见度量和报告实践指南。 ... ... @@ -261,14 +261,13 @@ 261 261 262 262 表2.2 实践成功因素的关键指标示例 263 263 264 -(% style="width:458px" %) 265 -|(% style="width:182px" %)**实践成功因素**|(% style="width:273px" %)**指标示例** 266 -|(% style="width:182px" %)尽早发现事件|(% style="width:273px" %)((( 265 +|**实践成功因素**|**指标示例** 266 +|尽早发现事件|((( 267 267 事件发生到发现之间的时间 268 268 269 269 通过监控和事态管理发现的事件百分比 270 270 ))) 271 -| (% style="width:182px" %)快速有效地解决事件|(% style="width:273px" %)(((271 +|快速有效地解决事件|((( 272 272 从事件发现到接受诊断之间的时间 273 273 274 274 派单次数 ... ... @@ -285,7 +285,7 @@ 285 285 286 286 用户报告之前已解决的事件的百分比 287 287 ))) 288 -| (% style="width:182px" %)不断改进事件管理方法|(% style="width:273px" %)(((288 +|不断改进事件管理方法|((( 289 289 使用先前确定和记录的解决方案的事件解决率 290 290 291 291 使用事件模型解决的事件的百分比 ... ... @@ -295,8 +295,6 @@ 295 295 事件解决的速度和有效性指标之间的平衡 296 296 ))) 297 297 298 - 299 - 300 300 ---- 301 301 302 302 = **3 价值流和流程** = ... ... @@ -337,6 +337,7 @@ 337 337 * **事件的处理和解决**。该流程的重点是从发现到关闭的单个事件的处理和解决。 338 338 * **定期事件评审**。该流程确保从事件处理和解决的过程中吸取教训,并确保持续改进事件管理的方法。 339 339 338 + 340 340 === **3.2.1 事件处理和解决** === 341 341 342 342 该过程包括表3.1中列出的活动,并将输入转换为输出。 ... ... @@ -373,11 +373,46 @@ 373 373 374 374 表3.2 事件处理和事件解决过程的活动 375 375 376 -[[image:1642222461983-817.png]] 375 +(% style="width:889px" %) 376 +|(% style="width:85px" %)**活动**|(% style="width:399px" %)**手动处理用户发现的事件**|(% style="width:403px" %)**自动发现和处理事件** 377 +|(% style="width:85px" %)事件发现|(% style="width:399px" %)用户发现服务运营中的故障,并通过约定的渠道与服务提供者的服务台联系。服务台客服对该用户问询进行初始分类,确认该问询确实属于事件。|(% style="width:403px" %)监控系统检测到事态,并基于预定义的分类将其标识为事件。 378 +|(% style="width:85px" %)事件登记|(% style="width:399px" %)服务台客服执行事件登记,将有效数据添加到事件记录中。|(% style="width:403px" %)登记事件记录并将其与发现事态的CI关联。登记预定义的技术参数。必要时,给相关技术专家发送通知。 379 +|(% style="width:85px" %)事件分类|(% style="width:399px" %)((( 380 +服务台客服完成事件初始分类;这有助于确定事件的影响,确定为失效CI和/或服务确定责任团队,并将事件关联到其他过去和正在处理的事态,事件和/或问题。 377 377 378 -[[image:1642222484248-277.png]] 382 +在某些情况下,分类有助于找到以前为此类事件定义的解决方案。 383 +)))|(% style="width:403px" %)((( 384 +根据预定义的规则,将自动发现: 379 379 386 +* 事件对服务和用户的影响 387 +* 可用的解决方案 388 +* 如果自动化解决方案无效或不可用,找到负责事件解决的技术团队。 389 +))) 390 +|(% style="width:85px" %)事件诊断|(% style="width:399px" %)((( 391 +如果分类没有关联到已知解决方案, 380 380 393 +专家团队开展事件诊断。这可能涉及将事件升级到不同团队,或其他联合技术团队加入(如全功能团队)。 394 + 395 +如果由于配置项关联错误而导致分类错误,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 396 +)))|(% style="width:403px" %)((( 397 +如果自动解决方案无效或不可用,则将事件上报给负责诊断的技术团队。可能涉及事件升级到不同团队,或其他技术团队加入(如全功能团队)。 398 + 399 +如果由于配置项关联错误而导致自动化解决方案失败,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 400 +))) 401 +|(% style="width:85px" %)事件解决|(% style="width:399px" %)找到解决方案后,相关专家团队将尝试按顺序或并行工作方式执行,这可能需要启动变更。如果解决方案不起作用,则再次诊断。|(% style="width:403px" %)如果有可用的自动化解决方案,则实施它,并完成测试和确认。如果需要手动干预,则相关的专业团队尝试实施,这可能需要启动变更。如果解决方案不起作用,则再次诊断。 402 +|(% style="width:85px" %)事件关闭|(% style="width:399px" %)((( 403 +成功解决事件之后,可能需要一些正式的关闭过程: 404 + 405 +* 用户确认服务恢复 406 +* 计算解决方案成本并报告 407 +* 解决方案结算报价和发票 408 +* 问题调查启动 409 +* 事件评审 410 + 411 +完成所有必需的操作并更新了相应地事件记录后,事件正式关闭。这可以由产品负责人,服务负责人,事件经理或服务台客服完成,具体取决于商定的事件模型。 412 +)))|(% style="width:403px" %)如果自动解决方案证明有效,则事件记录将自动更新并关闭。发送报告给负责的技术团队。如果在先前的任何步骤中已将有关事件的信息传达给其他利益相关者,则应向其传达事件关闭的信息。 413 + 414 + 381 381 === **3.2.2 定期事件评审** === 382 382 383 383 该流程的重点是持续改进事件管理实践,事件模型和事件处理程序。它可以定期执行,也可以由事件报告触发,该报告突显低效率和其他改进点机会。根据现有模型和程序的效果,每两到三个月或更短时间进行一次定期检查。 ... ... @@ -387,22 +387,22 @@ 387 387 388 388 表3.3定期事件评审的输入、输出和活动 389 389 390 -(% style="width: 406px" %)391 -|(% style="width: 139px" %)**关键输入**|(% style="width:146px" %)**活动**|(% style="width:117px" %)**关键输出**392 -|(% style="width: 139px" %)当前事件的模型和程序|(% style="width:146px" %)事件评审和事件记录分析|(% style="width:117px" %)更新的事件模型393 -|(% style="width: 139px" %)事件记录|(% style="width:146px" %)事件模型优化的启动|(% style="width:117px" %)更新的事件处理程序394 -|(% style="width: 139px" %)事件报告|(% style="width:146px" %) |(% style="width:117px" %)事件记录395 -|(% style="width: 139px" %)策略和法规要求|(% style="width:146px" %)事件模型更新的沟通|(% style="width:117px" %)更新的事件模型和过程的沟通396 -|(% style="width: 139px" %)配置信息|(% style="width:146px" %) |(% style="width:117px" %)397 -|(% style="width: 139px" %)IT资产信息|(% style="width:146px" %) |(% style="width:117px" %)变更请求398 -|(% style="width: 139px" %)与消费者和供应商/合作伙伴的SLA|(% style="width:146px" %) |(% style="width:117px" %)(((424 +(% style="width:738px" %) 425 +|(% style="width:297px" %)**关键输入**|(% style="width:233px" %)**活动**|(% style="width:207px" %)**关键输出** 426 +|(% style="width:297px" %)当前事件的模型和程序|(% style="width:233px" %)事件评审和事件记录分析|(% style="width:207px" %)更新的事件模型 427 +|(% style="width:297px" %)事件记录|(% style="width:233px" %)事件模型优化的启动|(% style="width:207px" %)更新的事件处理程序 428 +|(% style="width:297px" %)事件报告|(% style="width:233px" %) |(% style="width:207px" %)事件记录 429 +|(% style="width:297px" %)策略和法规要求|(% style="width:233px" %)事件模型更新的沟通|(% style="width:207px" %)更新的事件模型和过程的沟通 430 +|(% style="width:297px" %)配置信息|(% style="width:233px" %) |(% style="width:207px" %) 431 +|(% style="width:297px" %)IT资产信息|(% style="width:233px" %) |(% style="width:207px" %)变更请求 432 +|(% style="width:297px" %)与消费者和供应商/合作伙伴的SLA|(% style="width:233px" %) |(% style="width:207px" %)((( 399 399 改进计划 400 400 401 401 事件评审报告 402 402 ))) 403 -|(% style="width: 139px" %)容量和性能信息|(% style="width:146px" %) |(% style="width:117px" %)404 -|(% style="width: 139px" %)连续性策略和计划|(% style="width:146px" %) |(% style="width:117px" %)405 -|(% style="width: 139px" %)安全策略和计划|(% style="width:146px" %) |(% style="width:117px" %)437 +|(% style="width:297px" %)容量和性能信息|(% style="width:233px" %) |(% style="width:207px" %) 438 +|(% style="width:297px" %)连续性策略和计划|(% style="width:233px" %) |(% style="width:207px" %) 439 +|(% style="width:297px" %)安全策略和计划|(% style="width:233px" %) |(% style="width:207px" %) 406 406 407 407 图3.3 展示事件评审的工作流程图。 408 408 ... ... @@ -418,15 +418,14 @@ 418 418 419 419 表3.4 定期事件评审流程的活动 420 420 421 -(% style="width:434px" %) 422 -|(% style="width:106px" %)**活动**|(% style="width:326px" %)**示例** 423 -|(% style="width:106px" %)事件评审和事件记录分析|(% style="width:326px" %)事件经理与服务所有者和其他相关的利益相关者一起,对选定的事件(例如重大事件,未及时解决的事件或特定时期内的所有事件)实施评审,确定事件模型和事件处理程序的改进机会,包括事件处理和解决方案的自动化。 424 -|(% style="width:106px" %)事件模型优化的启动|(% style="width:326px" %)事件经理记录优化方案,它将通过持续改进实践或启动变更请求开始。(如果事件模型、程序和自动化包含在变更支持实践的范围内)。 425 -|(% style="width:106px" %)((( 455 +|**活动**|**示例** 456 +|事件评审和事件记录分析|事件经理与服务所有者和其他相关的利益相关者一起,对选定的事件(例如重大事件,未及时解决的事件或特定时期内的所有事件)实施评审,确定事件模型和事件处理程序的改进机会,包括事件处理和解决方案的自动化。 457 +|事件模型优化的启动|事件经理记录优化方案,它将通过持续改进实践或启动变更请求开始。(如果事件模型、程序和自动化包含在变更支持实践的范围内)。 458 +|((( 426 426 事件模型 427 427 428 428 变更的沟通 429 -)))| (% style="width:326px" %)如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。462 +)))|如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。 430 430 431 431 ---- 432 432 ... ... @@ -475,11 +475,101 @@ 475 475 476 476 表4.2负责事件管理活动的角色示例 477 477 478 -[[image:1642222648578-782.png]] 511 +|**实现价值**|**负责角色**|**能力简介**|**具体技能** 512 +|(% colspan="4" %)**事件处理和解决流程** 513 +|事件发现|((( 514 +技术专家 479 479 480 -[[image:1642222669993-827.png]] 516 +用户 517 +)))|TC|理解服务设计,资源配置和业务影响,了解事态的特征 518 +|事件登记|((( 519 +事件经理 481 481 521 +服务台客服 482 482 523 +技术专家 524 +)))|AT|熟练掌握IT服务管理(ITSM)工具和程序 525 +|事件分类|((( 526 +事件经理 527 + 528 +服务台客服 529 + 530 +技术专家 531 +)))|TC|((( 532 +理解服务设计,资源配置和业务影响 533 + 534 +熟悉事件解决的要求和承诺 535 + 536 +熟悉事件模型 537 +))) 538 +|事件诊断|((( 539 +供应商 540 + 541 +技术专家 542 +)))|TC|((( 543 +理解服务设计,资源配置和业务影响 544 + 545 +具备事件模型、诊断工具、诊断方法的知识 546 + 547 +分析能力 548 +))) 549 +|事件解决|((( 550 +供应商 551 + 552 +技术专家用户 553 +)))|T|了解事件解决的方法和程序要求 554 +|事件关闭|((( 555 +事件经理 556 + 557 +服务台客服 558 + 559 +技术专家 560 +)))|ACT|((( 561 +理解服务设计,资源配置和业务影响 562 + 563 +熟悉事件解决的要求和承诺 564 +))) 565 +|(% colspan="4" %)**定期事件评审流程** 566 +|事件评审和事件记录分析|((( 567 +事件经理 568 + 569 +产品负责人 570 + 571 +服务负责人 572 + 573 +供应商 574 +)))|TCL|((( 575 +理解服务设计,资源配置和业务影响 576 + 577 +熟悉事件解决的要求和承诺 578 + 579 +具备事件模型、诊断工具,诊断方法的知识和分析能力 580 +))) 581 +|事件模型优化的启动|((( 582 +事件经理 583 + 584 +产品负责人 585 + 586 +服务负责人 587 +)))|TMC|((( 588 +理解服务设计,资源配置和业务影响 589 + 590 +熟悉事件解决的要求和承诺 591 + 592 +具备事件模型、诊断工具,诊断方法的知识 593 + 594 +熟悉组织的持续改进和变更管理实践 595 +))) 596 +|事件模型变更的沟通|((( 597 +事件经理 598 + 599 +产品负责人 600 + 601 +服务台客服 602 + 603 +服务负责人 604 +)))|CA|熟悉沟通程序和沟通工具 605 + 483 483 == **4.2** **组织结构和团队** == 484 484 485 485 事件管理实践不推荐任何特定的组织模型。但是,组织结构会影响实践的执行方式,因为它涉及具有不同领域和专业水平的专家。专家分组的典型方法包括: ... ... @@ -580,9 +580,18 @@ 580 580 581 581 表5.1 事件记录中包含的数据 582 582 583 -[[image:1642222734298-342.png]] 706 +|**域**|**推荐内容**|**说明** 707 +|事件标题(简短说明)|观察到的降低或失效的功能或过程|带有清晰说明的解决方案搜索速度更快 708 +|用户|受影响的用户,被报告的用户| 709 +|当前影响|对用户/客户工作流程的实际影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 710 +|未来影响|如果事件持续下去,对客户的潜在影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 711 +|首次症状的时间|监控或用户体验中的日期和时间|诊断原因之前的准确时间点 712 +|最近一次正常状态的时间|验证功能正常的日期和时间|触发事态的准确时间点(此信息是人为添加还是自动记录的,可能会影响可信度) 713 +|受影响项目(功能,配置项,流程)的详细信息|资产ID号,应用程序和流程名称以及配置项索引|集中精力进行修复 714 +|未受影响的可比项目(如果有)的详细信息|未受影响的资产ID号,应用程序和流程名称以及配置项索引|缩小搜索范围 715 +|诊断详情(如果有)|诊断步骤和每步的结果|减少重复工作 716 +|分派|事件的个人或团队所有者| 584 584 585 - 586 586 == **5.2** **自动化和工具** == 587 587 588 588 事件管理实践应该是自动化的。在可行且有效的情况下,可能涉及表5.2中概述的解决方案。 ... ... @@ -594,12 +594,48 @@ 594 594 595 595 表5.2 事件管理活动的自动化解决方案 596 596 597 -[[image:1642222873598-155.png]] 729 +|**过程活动**|**自动化方式**|**关键功能**|**对实践有效性的影响** 730 +|(% colspan="4" %)**事件处理和解决流程** 731 +|事件发现|监控工具和事态相关引擎|早期的检测和事件关联,初始化事件管理实践|高 732 +|事件登记|用户查询管理和工作流程工具,以及协同工具|有效记录事件|高 733 +|事件分类|((( 734 +用户查询管理和工作流程工具, 598 598 599 - [[image:1642222893312-806.png]]736 +协同工具, 600 600 738 +知识管理工具, 601 601 740 +配置管理工具 602 602 742 +和基于机器学习的分类引擎 743 +)))|快速、准确的分类和事件分派,已知解决方案的识别,重大事件的识别|非常高,尤其是在事件数量多的情况下 744 +|事件诊断|((( 745 +分析和诊断工具 746 + 747 +知识管理工具 748 + 749 +配置管理工具 750 + 751 +协同工具 752 +)))|快速、准确的定义和测试假设,多个专家/团队的有效协作|高,特别是在需要手动协作的复杂事件数量很多时 753 +|事件解决|((( 754 +远程管理工具 755 + 756 +自动化的部署系统, 757 + 758 +和协同工具 759 +)))|快速纠正失效的配置项并恢复服务|高,特别是提供远程服务时 760 +|事件关闭|用户查询和工作流管理工具,和协同工具|快速而全面的回顾事件生命周期|中 761 +|**定期事件评审流程**| | | 762 +|事件评审和事件记录分析|协同系统,分析和报告系统以及调查工具|((( 763 +远程协作,事件数据分析和用户调查数据 764 + 765 +分析和报告 766 +)))|中到高,尤其是对批量事件 767 +|事件模型优化的启动|工作流系统和待办项管理工具|优化的正式登记|低到中 768 +|事件模型更新的沟通|通信系统和协作系统|与受影响团队沟通更新|中到高,尤其当组织较大,更新较多时为高 769 + 770 + 603 603 ---- 604 604 605 605 = **6 合作伙伴和供应商** =
- 1642222461983-817.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -117.4 KB - Content
- 1642222484248-277.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -68.3 KB - Content
- 1642222648578-782.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -62.3 KB - Content
- 1642222669993-827.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -46.5 KB - Content
- 1642222734298-342.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -84.0 KB - Content
- 1642222873598-155.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -72.6 KB - Content
- 1642222893312-806.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.superadmin - Size
-
... ... @@ -1,1 +1,0 @@ 1 -29.3 KB - Content