文档更改服务管理实践 - 02 事件
由 superadmin 于 2024/12/25, 15:38 最后修改
修改评论
上传新附件1642222893312-806.png
Summary
Details
- Page properties
-
- Content
-
... ... @@ -131,12 +131,11 @@ 131 131 132 132 表2.1 其他实践中描述的与事件管理实践相关的活动 133 133 134 -(% style="width:364px" %) 135 -|(% style="width:204px" %)**活动**|(% style="width:157px" %)**实践指南** 136 -|(% style="width:204px" %)调查事件原因|(% style="width:157px" %)问题管理 137 -|(% style="width:204px" %)与用户沟通|(% style="width:157px" %)服务台 138 -|(% style="width:204px" %)实施产品和服务的变更|(% style="width:157px" %)变更支持 139 -|(% style="width:204px" %) |(% style="width:157px" %)((( 134 +|**活动**|**实践指南** 135 +|调查事件原因|问题管理 136 +|与用户沟通|服务台 137 +|实施产品和服务的变更|变更支持 138 +| |((( 140 140 部署管理 141 141 142 142 基础设施和平台管理 ... ... @@ -147,10 +147,10 @@ 147 147 148 148 软件开发和管理 149 149 ))) 150 -| (% style="width:204px" %)监控技术,团队和供应商绩效|(% style="width:157px" %)监控和事态管理151 -| (% style="width:204px" %)改进计划的管理|(% style="width:157px" %)持续改进152 -| (% style="width:204px" %)服务请求的管理和执行|(% style="width:157px" %)服务请求管理153 -| (% style="width:204px" %)灾难情况下,恢复正常操作|(% style="width:157px" %)服务连续性管理149 +|监控技术,团队和供应商绩效|监控和事态管理 150 +|改进计划的管理|持续改进 151 +|服务请求的管理和执行|服务请求管理 152 +|灾难情况下,恢复正常操作|服务连续性管理 154 154 155 155 == **2.4** **实践成功因素** == 156 156 ... ... @@ -260,14 +260,13 @@ 260 260 261 261 表2.2 实践成功因素的关键指标示例 262 262 263 -(% style="width:458px" %) 264 -|(% style="width:182px" %)**实践成功因素**|(% style="width:273px" %)**指标示例** 265 -|(% style="width:182px" %)尽早发现事件|(% style="width:273px" %)((( 262 +|**实践成功因素**|**指标示例** 263 +|尽早发现事件|((( 266 266 事件发生到发现之间的时间 267 267 268 268 通过监控和事态管理发现的事件百分比 269 269 ))) 270 -| (% style="width:182px" %)快速有效地解决事件|(% style="width:273px" %)(((268 +|快速有效地解决事件|((( 271 271 从事件发现到接受诊断之间的时间 272 272 273 273 派单次数 ... ... @@ -284,7 +284,7 @@ 284 284 285 285 用户报告之前已解决的事件的百分比 286 286 ))) 287 -| (% style="width:182px" %)不断改进事件管理方法|(% style="width:273px" %)(((285 +|不断改进事件管理方法|((( 288 288 使用先前确定和记录的解决方案的事件解决率 289 289 290 290 使用事件模型解决的事件的百分比 ... ... @@ -294,9 +294,6 @@ 294 294 事件解决的速度和有效性指标之间的平衡 295 295 ))) 296 296 297 - 298 - 299 - 300 300 ---- 301 301 302 302 = **3 价值流和流程** = ... ... @@ -373,11 +373,45 @@ 373 373 374 374 表3.2 事件处理和事件解决过程的活动 375 375 376 -[[image:1642222461983-817.png]] 371 +(% style="width:889px" %) 372 +|(% style="width:85px" %)**活动**|(% style="width:399px" %)**手动处理用户发现的事件**|(% style="width:403px" %)**自动发现和处理事件** 373 +|(% style="width:85px" %)事件发现|(% style="width:399px" %)用户发现服务运营中的故障,并通过约定的渠道与服务提供者的服务台联系。服务台客服对该用户问询进行初始分类,确认该问询确实属于事件。|(% style="width:403px" %)监控系统检测到事态,并基于预定义的分类将其标识为事件。 374 +|(% style="width:85px" %)事件登记|(% style="width:399px" %)服务台客服执行事件登记,将有效数据添加到事件记录中。|(% style="width:403px" %)登记事件记录并将其与发现事态的CI关联。登记预定义的技术参数。必要时,给相关技术专家发送通知。 375 +|(% style="width:85px" %)事件分类|(% style="width:399px" %)((( 376 +服务台客服完成事件初始分类;这有助于确定事件的影响,确定为失效CI和/或服务确定责任团队,并将事件关联到其他过去和正在处理的事态,事件和/或问题。 377 377 378 -[[image:1642222484248-277.png]] 378 +在某些情况下,分类有助于找到以前为此类事件定义的解决方案。 379 +)))|(% style="width:403px" %)((( 380 +根据预定义的规则,将自动发现: 379 379 382 +* 事件对服务和用户的影响 383 +* 可用的解决方案 384 +* 如果自动化解决方案无效或不可用,找到负责事件解决的技术团队。 385 +))) 386 +|(% style="width:85px" %)事件诊断|(% style="width:399px" %)((( 387 +如果分类没有关联到已知解决方案, 380 380 389 +专家团队开展事件诊断。这可能涉及将事件升级到不同团队,或其他联合技术团队加入(如全功能团队)。 390 + 391 +如果由于配置项关联错误而导致分类错误,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 392 +)))|(% style="width:403px" %)((( 393 +如果自动解决方案无效或不可用,则将事件上报给负责诊断的技术团队。可能涉及事件升级到不同团队,或其他技术团队加入(如全功能团队)。 394 + 395 +如果由于配置项关联错误而导致自动化解决方案失败,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 396 +))) 397 +|(% style="width:85px" %)事件解决|(% style="width:399px" %)找到解决方案后,相关专家团队将尝试按顺序或并行工作方式执行,这可能需要启动变更。如果解决方案不起作用,则再次诊断。|(% style="width:403px" %)如果有可用的自动化解决方案,则实施它,并完成测试和确认。如果需要手动干预,则相关的专业团队尝试实施,这可能需要启动变更。如果解决方案不起作用,则再次诊断。 398 +|(% style="width:85px" %)事件关闭|(% style="width:399px" %)((( 399 +成功解决事件之后,可能需要一些正式的关闭过程: 400 + 401 +* 用户确认服务恢复 402 +* 计算解决方案成本并报告 403 +* 解决方案结算报价和发票 404 +* 问题调查启动 405 +* 事件评审 406 + 407 +完成所有必需的操作并更新了相应地事件记录后,事件正式关闭。这可以由产品负责人,服务负责人,事件经理或服务台客服完成,具体取决于商定的事件模型。 408 +)))|(% style="width:403px" %)如果自动解决方案证明有效,则事件记录将自动更新并关闭。发送报告给负责的技术团队。如果在先前的任何步骤中已将有关事件的信息传达给其他利益相关者,则应向其传达事件关闭的信息。 409 + 381 381 === **3.2.2 定期事件评审** === 382 382 383 383 该流程的重点是持续改进事件管理实践,事件模型和事件处理程序。它可以定期执行,也可以由事件报告触发,该报告突显低效率和其他改进点机会。根据现有模型和程序的效果,每两到三个月或更短时间进行一次定期检查。 ... ... @@ -387,22 +387,22 @@ 387 387 388 388 表3.3定期事件评审的输入、输出和活动 389 389 390 -(% style="width: 406px" %)391 -|(% style="width: 139px" %)**关键输入**|(% style="width:146px" %)**活动**|(% style="width:117px" %)**关键输出**392 -|(% style="width: 139px" %)当前事件的模型和程序|(% style="width:146px" %)事件评审和事件记录分析|(% style="width:117px" %)更新的事件模型393 -|(% style="width: 139px" %)事件记录|(% style="width:146px" %)事件模型优化的启动|(% style="width:117px" %)更新的事件处理程序394 -|(% style="width: 139px" %)事件报告|(% style="width:146px" %) |(% style="width:117px" %)事件记录395 -|(% style="width: 139px" %)策略和法规要求|(% style="width:146px" %)事件模型更新的沟通|(% style="width:117px" %)更新的事件模型和过程的沟通396 -|(% style="width: 139px" %)配置信息|(% style="width:146px" %) |(% style="width:117px" %)397 -|(% style="width: 139px" %)IT资产信息|(% style="width:146px" %) |(% style="width:117px" %)变更请求398 -|(% style="width: 139px" %)与消费者和供应商/合作伙伴的SLA|(% style="width:146px" %) |(% style="width:117px" %)(((419 +(% style="width:738px" %) 420 +|(% style="width:297px" %)**关键输入**|(% style="width:233px" %)**活动**|(% style="width:207px" %)**关键输出** 421 +|(% style="width:297px" %)当前事件的模型和程序|(% style="width:233px" %)事件评审和事件记录分析|(% style="width:207px" %)更新的事件模型 422 +|(% style="width:297px" %)事件记录|(% style="width:233px" %)事件模型优化的启动|(% style="width:207px" %)更新的事件处理程序 423 +|(% style="width:297px" %)事件报告|(% style="width:233px" %) |(% style="width:207px" %)事件记录 424 +|(% style="width:297px" %)策略和法规要求|(% style="width:233px" %)事件模型更新的沟通|(% style="width:207px" %)更新的事件模型和过程的沟通 425 +|(% style="width:297px" %)配置信息|(% style="width:233px" %) |(% style="width:207px" %) 426 +|(% style="width:297px" %)IT资产信息|(% style="width:233px" %) |(% style="width:207px" %)变更请求 427 +|(% style="width:297px" %)与消费者和供应商/合作伙伴的SLA|(% style="width:233px" %) |(% style="width:207px" %)((( 399 399 改进计划 400 400 401 401 事件评审报告 402 402 ))) 403 -|(% style="width: 139px" %)容量和性能信息|(% style="width:146px" %) |(% style="width:117px" %)404 -|(% style="width: 139px" %)连续性策略和计划|(% style="width:146px" %) |(% style="width:117px" %)405 -|(% style="width: 139px" %)安全策略和计划|(% style="width:146px" %) |(% style="width:117px" %)432 +|(% style="width:297px" %)容量和性能信息|(% style="width:233px" %) |(% style="width:207px" %) 433 +|(% style="width:297px" %)连续性策略和计划|(% style="width:233px" %) |(% style="width:207px" %) 434 +|(% style="width:297px" %)安全策略和计划|(% style="width:233px" %) |(% style="width:207px" %) 406 406 407 407 图3.3 展示事件评审的工作流程图。 408 408 ... ... @@ -418,17 +418,15 @@ 418 418 419 419 表3.4 定期事件评审流程的活动 420 420 421 -(% style="width:434px" %) 422 -|(% style="width:106px" %)**活动**|(% style="width:326px" %)**示例** 423 -|(% style="width:106px" %)事件评审和事件记录分析|(% style="width:326px" %)事件经理与服务所有者和其他相关的利益相关者一起,对选定的事件(例如重大事件,未及时解决的事件或特定时期内的所有事件)实施评审,确定事件模型和事件处理程序的改进机会,包括事件处理和解决方案的自动化。 424 -|(% style="width:106px" %)事件模型优化的启动|(% style="width:326px" %)事件经理记录优化方案,它将通过持续改进实践或启动变更请求开始。(如果事件模型、程序和自动化包含在变更支持实践的范围内)。 425 -|(% style="width:106px" %)((( 450 +|**活动**|**示例** 451 +|事件评审和事件记录分析|事件经理与服务所有者和其他相关的利益相关者一起,对选定的事件(例如重大事件,未及时解决的事件或特定时期内的所有事件)实施评审,确定事件模型和事件处理程序的改进机会,包括事件处理和解决方案的自动化。 452 +|事件模型优化的启动|事件经理记录优化方案,它将通过持续改进实践或启动变更请求开始。(如果事件模型、程序和自动化包含在变更支持实践的范围内)。 453 +|((( 426 426 事件模型 427 427 428 428 变更的沟通 429 -)))| (% style="width:326px" %)如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。457 +)))|如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。 430 430 431 - 432 432 ---- 433 433 434 434 = **4 组织和人员** = ... ... @@ -476,11 +476,101 @@ 476 476 477 477 表4.2负责事件管理活动的角色示例 478 478 479 -[[image:1642222648578-782.png]] 506 +|**实现价值**|**负责角色**|**能力简介**|**具体技能** 507 +|(% colspan="4" %)**事件处理和解决流程** 508 +|事件发现|((( 509 +技术专家 480 480 481 -[[image:1642222669993-827.png]] 511 +用户 512 +)))|TC|理解服务设计,资源配置和业务影响,了解事态的特征 513 +|事件登记|((( 514 +事件经理 482 482 516 +服务台客服 483 483 518 +技术专家 519 +)))|AT|熟练掌握IT服务管理(ITSM)工具和程序 520 +|事件分类|((( 521 +事件经理 522 + 523 +服务台客服 524 + 525 +技术专家 526 +)))|TC|((( 527 +理解服务设计,资源配置和业务影响 528 + 529 +熟悉事件解决的要求和承诺 530 + 531 +熟悉事件模型 532 +))) 533 +|事件诊断|((( 534 +供应商 535 + 536 +技术专家 537 +)))|TC|((( 538 +理解服务设计,资源配置和业务影响 539 + 540 +具备事件模型、诊断工具、诊断方法的知识 541 + 542 +分析能力 543 +))) 544 +|事件解决|((( 545 +供应商 546 + 547 +技术专家用户 548 +)))|T|了解事件解决的方法和程序要求 549 +|事件关闭|((( 550 +事件经理 551 + 552 +服务台客服 553 + 554 +技术专家 555 +)))|ACT|((( 556 +理解服务设计,资源配置和业务影响 557 + 558 +熟悉事件解决的要求和承诺 559 +))) 560 +|(% colspan="4" %)**定期事件评审流程** 561 +|事件评审和事件记录分析|((( 562 +事件经理 563 + 564 +产品负责人 565 + 566 +服务负责人 567 + 568 +供应商 569 +)))|TCL|((( 570 +理解服务设计,资源配置和业务影响 571 + 572 +熟悉事件解决的要求和承诺 573 + 574 +具备事件模型、诊断工具,诊断方法的知识和分析能力 575 +))) 576 +|事件模型优化的启动|((( 577 +事件经理 578 + 579 +产品负责人 580 + 581 +服务负责人 582 +)))|TMC|((( 583 +理解服务设计,资源配置和业务影响 584 + 585 +熟悉事件解决的要求和承诺 586 + 587 +具备事件模型、诊断工具,诊断方法的知识 588 + 589 +熟悉组织的持续改进和变更管理实践 590 +))) 591 +|事件模型变更的沟通|((( 592 +事件经理 593 + 594 +产品负责人 595 + 596 +服务台客服 597 + 598 +服务负责人 599 +)))|CA|熟悉沟通程序和沟通工具 600 + 484 484 == **4.2** **组织结构和团队** == 485 485 486 486 事件管理实践不推荐任何特定的组织模型。但是,组织结构会影响实践的执行方式,因为它涉及具有不同领域和专业水平的专家。专家分组的典型方法包括: ... ... @@ -581,9 +581,18 @@ 581 581 582 582 表5.1 事件记录中包含的数据 583 583 584 -[[image:1642222734298-342.png]] 701 +|**域**|**推荐内容**|**说明** 702 +|事件标题(简短说明)|观察到的降低或失效的功能或过程|带有清晰说明的解决方案搜索速度更快 703 +|用户|受影响的用户,被报告的用户| 704 +|当前影响|对用户/客户工作流程的实际影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 705 +|未来影响|如果事件持续下去,对客户的潜在影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 706 +|首次症状的时间|监控或用户体验中的日期和时间|诊断原因之前的准确时间点 707 +|最近一次正常状态的时间|验证功能正常的日期和时间|触发事态的准确时间点(此信息是人为添加还是自动记录的,可能会影响可信度) 708 +|受影响项目(功能,配置项,流程)的详细信息|资产ID号,应用程序和流程名称以及配置项索引|集中精力进行修复 709 +|未受影响的可比项目(如果有)的详细信息|未受影响的资产ID号,应用程序和流程名称以及配置项索引|缩小搜索范围 710 +|诊断详情(如果有)|诊断步骤和每步的结果|减少重复工作 711 +|分派|事件的个人或团队所有者| 585 585 586 - 587 587 == **5.2** **自动化和工具** == 588 588 589 589 事件管理实践应该是自动化的。在可行且有效的情况下,可能涉及表5.2中概述的解决方案。 ... ... @@ -595,12 +595,47 @@ 595 595 596 596 表5.2 事件管理活动的自动化解决方案 597 597 598 -[[image:1642222873598-155.png]] 724 +|**过程活动**|**自动化方式**|**关键功能**|**对实践有效性的影响** 725 +|(% colspan="4" %)**事件处理和解决流程** 726 +|事件发现|监控工具和事态相关引擎|早期的检测和事件关联,初始化事件管理实践|高 727 +|事件登记|用户查询管理和工作流程工具,以及协同工具|有效记录事件|高 728 +|事件分类|((( 729 +用户查询管理和工作流程工具, 599 599 600 - [[image:1642222893312-806.png]]731 +协同工具, 601 601 733 +知识管理工具, 602 602 735 +配置管理工具 603 603 737 +和基于机器学习的分类引擎 738 +)))|快速、准确的分类和事件分派,已知解决方案的识别,重大事件的识别|非常高,尤其是在事件数量多的情况下 739 +|事件诊断|((( 740 +分析和诊断工具 741 + 742 +知识管理工具 743 + 744 +配置管理工具 745 + 746 +协同工具 747 +)))|快速、准确的定义和测试假设,多个专家/团队的有效协作|高,特别是在需要手动协作的复杂事件数量很多时 748 +|事件解决|((( 749 +远程管理工具 750 + 751 +自动化的部署系统, 752 + 753 +和协同工具 754 +)))|快速纠正失效的配置项并恢复服务|高,特别是提供远程服务时 755 +|事件关闭|用户查询和工作流管理工具,和协同工具|快速而全面的回顾事件生命周期|中 756 +|**定期事件评审流程**| | | 757 +|事件评审和事件记录分析|协同系统,分析和报告系统以及调查工具|((( 758 +远程协作,事件数据分析和用户调查数据 759 + 760 +分析和报告 761 +)))|中到高,尤其是对批量事件 762 +|事件模型优化的启动|工作流系统和待办项管理工具|优化的正式登记|低到中 763 +|事件模型更新的沟通|通信系统和协作系统|与受影响团队沟通更新|中到高,尤其当组织较大,更新较多时为高 764 + 604 604 ---- 605 605 606 606 = **6 合作伙伴和供应商** =