文档更改服务管理实践 - 02 事件
由 superadmin 于 2024/12/25, 15:38 最后修改
修改评论
该版本没有评论
Summary
Details
- Page properties
-
- Content
-
... ... @@ -368,45 +368,11 @@ 368 368 369 369 表3.2 事件处理和事件解决过程的活动 370 370 371 -(% style="width:889px" %) 372 -|(% style="width:85px" %)**活动**|(% style="width:399px" %)**手动处理用户发现的事件**|(% style="width:403px" %)**自动发现和处理事件** 373 -|(% style="width:85px" %)事件发现|(% style="width:399px" %)用户发现服务运营中的故障,并通过约定的渠道与服务提供者的服务台联系。服务台客服对该用户问询进行初始分类,确认该问询确实属于事件。|(% style="width:403px" %)监控系统检测到事态,并基于预定义的分类将其标识为事件。 374 -|(% style="width:85px" %)事件登记|(% style="width:399px" %)服务台客服执行事件登记,将有效数据添加到事件记录中。|(% style="width:403px" %)登记事件记录并将其与发现事态的CI关联。登记预定义的技术参数。必要时,给相关技术专家发送通知。 375 -|(% style="width:85px" %)事件分类|(% style="width:399px" %)((( 376 -服务台客服完成事件初始分类;这有助于确定事件的影响,确定为失效CI和/或服务确定责任团队,并将事件关联到其他过去和正在处理的事态,事件和/或问题。 371 +[[image:1642222461983-817.png]] 377 377 378 -在某些情况下,分类有助于找到以前为此类事件定义的解决方案。 379 -)))|(% style="width:403px" %)((( 380 -根据预定义的规则,将自动发现: 373 +[[image:1642222484248-277.png]] 381 381 382 -* 事件对服务和用户的影响 383 -* 可用的解决方案 384 -* 如果自动化解决方案无效或不可用,找到负责事件解决的技术团队。 385 -))) 386 -|(% style="width:85px" %)事件诊断|(% style="width:399px" %)((( 387 -如果分类没有关联到已知解决方案, 388 388 389 -专家团队开展事件诊断。这可能涉及将事件升级到不同团队,或其他联合技术团队加入(如全功能团队)。 390 - 391 -如果由于配置项关联错误而导致分类错误,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 392 -)))|(% style="width:403px" %)((( 393 -如果自动解决方案无效或不可用,则将事件上报给负责诊断的技术团队。可能涉及事件升级到不同团队,或其他技术团队加入(如全功能团队)。 394 - 395 -如果由于配置项关联错误而导致自动化解决方案失败,则应将此信息传达给负责配置管理的人员(请参阅服务配置实践指南)。 396 -))) 397 -|(% style="width:85px" %)事件解决|(% style="width:399px" %)找到解决方案后,相关专家团队将尝试按顺序或并行工作方式执行,这可能需要启动变更。如果解决方案不起作用,则再次诊断。|(% style="width:403px" %)如果有可用的自动化解决方案,则实施它,并完成测试和确认。如果需要手动干预,则相关的专业团队尝试实施,这可能需要启动变更。如果解决方案不起作用,则再次诊断。 398 -|(% style="width:85px" %)事件关闭|(% style="width:399px" %)((( 399 -成功解决事件之后,可能需要一些正式的关闭过程: 400 - 401 -* 用户确认服务恢复 402 -* 计算解决方案成本并报告 403 -* 解决方案结算报价和发票 404 -* 问题调查启动 405 -* 事件评审 406 - 407 -完成所有必需的操作并更新了相应地事件记录后,事件正式关闭。这可以由产品负责人,服务负责人,事件经理或服务台客服完成,具体取决于商定的事件模型。 408 -)))|(% style="width:403px" %)如果自动解决方案证明有效,则事件记录将自动更新并关闭。发送报告给负责的技术团队。如果在先前的任何步骤中已将有关事件的信息传达给其他利益相关者,则应向其传达事件关闭的信息。 409 - 410 410 === **3.2.2 定期事件评审** === 411 411 412 412 该流程的重点是持续改进事件管理实践,事件模型和事件处理程序。它可以定期执行,也可以由事件报告触发,该报告突显低效率和其他改进点机会。根据现有模型和程序的效果,每两到三个月或更短时间进行一次定期检查。 ... ... @@ -456,6 +456,8 @@ 456 456 变更的沟通 457 457 )))|如果事件模型成功地完成优化,这一事实将会传达给相关的利益相关者。这通常由事件经理和/或服务或资源所有者通过沟通过程完成。 458 458 425 + 426 + 459 459 ---- 460 460 461 461 = **4 组织和人员** = ... ... @@ -503,101 +503,11 @@ 503 503 504 504 表4.2负责事件管理活动的角色示例 505 505 506 -|**实现价值**|**负责角色**|**能力简介**|**具体技能** 507 -|(% colspan="4" %)**事件处理和解决流程** 508 -|事件发现|((( 509 -技术专家 474 +[[image:1642222648578-782.png]] 510 510 511 -用户 512 -)))|TC|理解服务设计,资源配置和业务影响,了解事态的特征 513 -|事件登记|((( 514 -事件经理 476 +[[image:1642222669993-827.png]] 515 515 516 -服务台客服 517 517 518 -技术专家 519 -)))|AT|熟练掌握IT服务管理(ITSM)工具和程序 520 -|事件分类|((( 521 -事件经理 522 - 523 -服务台客服 524 - 525 -技术专家 526 -)))|TC|((( 527 -理解服务设计,资源配置和业务影响 528 - 529 -熟悉事件解决的要求和承诺 530 - 531 -熟悉事件模型 532 -))) 533 -|事件诊断|((( 534 -供应商 535 - 536 -技术专家 537 -)))|TC|((( 538 -理解服务设计,资源配置和业务影响 539 - 540 -具备事件模型、诊断工具、诊断方法的知识 541 - 542 -分析能力 543 -))) 544 -|事件解决|((( 545 -供应商 546 - 547 -技术专家用户 548 -)))|T|了解事件解决的方法和程序要求 549 -|事件关闭|((( 550 -事件经理 551 - 552 -服务台客服 553 - 554 -技术专家 555 -)))|ACT|((( 556 -理解服务设计,资源配置和业务影响 557 - 558 -熟悉事件解决的要求和承诺 559 -))) 560 -|(% colspan="4" %)**定期事件评审流程** 561 -|事件评审和事件记录分析|((( 562 -事件经理 563 - 564 -产品负责人 565 - 566 -服务负责人 567 - 568 -供应商 569 -)))|TCL|((( 570 -理解服务设计,资源配置和业务影响 571 - 572 -熟悉事件解决的要求和承诺 573 - 574 -具备事件模型、诊断工具,诊断方法的知识和分析能力 575 -))) 576 -|事件模型优化的启动|((( 577 -事件经理 578 - 579 -产品负责人 580 - 581 -服务负责人 582 -)))|TMC|((( 583 -理解服务设计,资源配置和业务影响 584 - 585 -熟悉事件解决的要求和承诺 586 - 587 -具备事件模型、诊断工具,诊断方法的知识 588 - 589 -熟悉组织的持续改进和变更管理实践 590 -))) 591 -|事件模型变更的沟通|((( 592 -事件经理 593 - 594 -产品负责人 595 - 596 -服务台客服 597 - 598 -服务负责人 599 -)))|CA|熟悉沟通程序和沟通工具 600 - 601 601 == **4.2** **组织结构和团队** == 602 602 603 603 事件管理实践不推荐任何特定的组织模型。但是,组织结构会影响实践的执行方式,因为它涉及具有不同领域和专业水平的专家。专家分组的典型方法包括: ... ... @@ -698,18 +698,9 @@ 698 698 699 699 表5.1 事件记录中包含的数据 700 700 701 -|**域**|**推荐内容**|**说明** 702 -|事件标题(简短说明)|观察到的降低或失效的功能或过程|带有清晰说明的解决方案搜索速度更快 703 -|用户|受影响的用户,被报告的用户| 704 -|当前影响|对用户/客户工作流程的实际影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 705 -|未来影响|如果事件持续下去,对客户的潜在影响的文字说明|创建上下文,允许排障组提供适当的变通或者解决方法 706 -|首次症状的时间|监控或用户体验中的日期和时间|诊断原因之前的准确时间点 707 -|最近一次正常状态的时间|验证功能正常的日期和时间|触发事态的准确时间点(此信息是人为添加还是自动记录的,可能会影响可信度) 708 -|受影响项目(功能,配置项,流程)的详细信息|资产ID号,应用程序和流程名称以及配置项索引|集中精力进行修复 709 -|未受影响的可比项目(如果有)的详细信息|未受影响的资产ID号,应用程序和流程名称以及配置项索引|缩小搜索范围 710 -|诊断详情(如果有)|诊断步骤和每步的结果|减少重复工作 711 -|分派|事件的个人或团队所有者| 579 +[[image:1642222734298-342.png]] 712 712 581 + 713 713 == **5.2** **自动化和工具** == 714 714 715 715 事件管理实践应该是自动化的。在可行且有效的情况下,可能涉及表5.2中概述的解决方案。 ... ... @@ -721,47 +721,12 @@ 721 721 722 722 表5.2 事件管理活动的自动化解决方案 723 723 724 -|**过程活动**|**自动化方式**|**关键功能**|**对实践有效性的影响** 725 -|(% colspan="4" %)**事件处理和解决流程** 726 -|事件发现|监控工具和事态相关引擎|早期的检测和事件关联,初始化事件管理实践|高 727 -|事件登记|用户查询管理和工作流程工具,以及协同工具|有效记录事件|高 728 -|事件分类|((( 729 -用户查询管理和工作流程工具, 593 +[[image:1642222873598-155.png]] 730 730 731 - 协同工具,595 +[[image:1642222893312-806.png]] 732 732 733 -知识管理工具, 734 734 735 -配置管理工具 736 736 737 -和基于机器学习的分类引擎 738 -)))|快速、准确的分类和事件分派,已知解决方案的识别,重大事件的识别|非常高,尤其是在事件数量多的情况下 739 -|事件诊断|((( 740 -分析和诊断工具 741 - 742 -知识管理工具 743 - 744 -配置管理工具 745 - 746 -协同工具 747 -)))|快速、准确的定义和测试假设,多个专家/团队的有效协作|高,特别是在需要手动协作的复杂事件数量很多时 748 -|事件解决|((( 749 -远程管理工具 750 - 751 -自动化的部署系统, 752 - 753 -和协同工具 754 -)))|快速纠正失效的配置项并恢复服务|高,特别是提供远程服务时 755 -|事件关闭|用户查询和工作流管理工具,和协同工具|快速而全面的回顾事件生命周期|中 756 -|**定期事件评审流程**| | | 757 -|事件评审和事件记录分析|协同系统,分析和报告系统以及调查工具|((( 758 -远程协作,事件数据分析和用户调查数据 759 - 760 -分析和报告 761 -)))|中到高,尤其是对批量事件 762 -|事件模型优化的启动|工作流系统和待办项管理工具|优化的正式登记|低到中 763 -|事件模型更新的沟通|通信系统和协作系统|与受影响团队沟通更新|中到高,尤其当组织较大,更新较多时为高 764 - 765 765 ---- 766 766 767 767 = **6 合作伙伴和供应商** =