Changes for page 服务管理实践 - 14 服务连续性
Last modified by superadmin on 2024/12/25, 15:40
Summary
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 -14 服务连续性管理 实践1 +14 服务连续性管理(尚未发布) - Content
-
... ... @@ -1,23 +1,27 @@ 1 -{{box cssClass="floatinginfobox" title="**Contents**"}} 2 -{{toc/}} 3 -{{/box}} 4 - 1 +(% class="jumbotron" %) 5 5 ((( 3 +(% class="container" %) 4 +((( 5 += = 6 + 7 + 8 + 9 + 10 + 6 6 7 7 ))) 13 +))) 8 8 9 9 需要下载 **ITIL 4 服务连续性管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“服务连续性”即可。 10 10 11 - [[image:微信截图_20210206234644.png]] 17 +[[image:file:///C:/Users/19805/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png]] [[image:微信截图_20210206234644.png]] 12 12 13 13 **申明:** 14 14 15 15 本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。 16 16 17 - 18 18 请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。 19 19 20 - 21 21 翻译:李天池 审校:张宏伟 审核:谢帅 22 22 23 23 ... ... @@ -176,6 +176,7 @@ 176 176 * 中断期间应能够访问服务的有限的用户数量或特定用户组 177 177 * 中断期间用户应能够处理的单位时间段内有限的交易数量。 178 178 183 + 179 179 === **2.2.5 业务影响分析** === 180 180 181 181 |((( ... ... @@ -193,6 +193,7 @@ 193 193 * 设置优先级时间范围以在明确规定的最低可接受水平上恢复这些活动,考虑到在这时间内不恢复它们,带来的影响将变得不可接受 194 194 * 确定这些活动的依赖关系和支持资源,包括供应商,外包合作伙伴,以及其他相关利益方。 195 195 201 + 196 196 === **2.2.6 服务连续性/ 灾难恢复计划** === 197 197 198 198 |((( ... ... @@ -242,6 +242,7 @@ 242 242 |实施风险缓解措施并更改IT基础设施,以确保弹性|项目管理, 变更控制 243 243 |管理并实施持续改进|持续改进 244 244 251 + 245 245 === **2.3.1 可用性与连续性之间的界线** === 246 246 247 247 服务的连续性和可用性管理的实践之间的界限是不明显的。两种做法都涉及风险的概念,并致力于识别和准备应对可能威胁并导致服务不能运转的事件。对于这两种实践,都需要了解VBF和风险评估或服务故障的BIA。最终,两种做法都确保了组织的抗故障能力。 ... ... @@ -282,6 +282,7 @@ 282 282 服务提供者必须承诺服务连续性计划,以便继续服务的交付。 283 283 ))) 284 284 292 + 285 285 === **2.3.3 服务连续性实践在管理风险时的角色** === 286 286 287 287 风险的概念是服务连续性管理实践的核心。该实践通常关注于减轻无法完全防止的高影响,低概率风险。 ... ... @@ -341,8 +341,8 @@ 341 341 342 342 服务连续性计划根据服务提供者的类型和组织的规模,其结构的复杂度可能会或多或少。表2.4 概述了一些常见的结构。 343 343 344 -| (%style="width:122px" %)|(% style="width:290px" %)小型组织|大型组织345 -| (% style="width:122px" %)内部服务提供商|(% style="width:290px" %)(((352 +| |小型组织|大型组织 353 +|内部服务提供商|((( 346 346 在小型组织的IT部门中,可能没有任何服务连续性计划。所有连续性安排都可以作为业务连续性管理的一部分进行管理。 347 347 348 348 特定的IT服务连续性活动可以作为事件管理实践的一部分执行。 ... ... @@ -353,7 +353,7 @@ 353 353 354 354 操作层:大量的用于特定恢复活动的详细步骤(例如,从备份中恢复应用程序数据)。其他部门可能会有自己的特定操作说明,作为连续性计划的一部分。 355 355 ))) 356 -| (% style="width:122px" %)外部服务提供商|(% style="width:290px" %)所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。364 +|外部服务提供商|所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。 357 357 358 358 表2.4 连续性计划的结构选项 359 359 ... ... @@ -360,9 +360,9 @@ 360 360 361 361 服务连续性计划应涵盖表2.5中概述的灾难发生之后的各个阶段。 362 362 363 -| (% style="width:79px" %)阶段|(% style="width:503px" %)响应|恢复|复原364 -| (% style="width:79px" %)计划|(% style="width:503px" %)响应计划|恢复计划|恢复正常运行计划365 -| (% style="width:79px" %)内容|(% style="width:503px" %)(((371 +|阶段|响应|恢复|复原 372 +|计划|响应计划|恢复计划|恢复正常运行计划 373 +|内容|((( 366 366 应触发服务连续性计划的事件和场景 367 367 368 368 危机管理组联系人 ... ... @@ -406,27 +406,27 @@ 406 406 407 407 表2.6 中概述的服务连续性选项可以作为总体风险缓解计划的一部分来设计和实现。 408 408 409 -| (% style="width:174px" %)服务管理维度|(% style="width:842px" %)服务连续性措施410 -| (% style="width:174px" %)组织和人员|(% style="width:842px" %)(((411 - *在灾难期间的人员管理412 - *使用替代站点和设施417 +|服务管理维度|服务连续性措施 418 +|组织和人员|((( 419 +1. 在灾难期间的人员管理 420 +1. 使用替代站点和设施 413 413 ))) 414 -| (% style="width:174px" %)信息和技术|(% style="width:842px" %)(((415 - *物理安全416 - *弹性电信网络417 - *运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性418 - *数据备份419 - *容错应用程序420 - *监控以提供及时告警422 +|信息和技术|((( 423 +1. 物理安全 424 +1. 弹性电信网络 425 +1. 运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性 426 +1. 数据备份 427 +1. 容错应用程序 428 +1. 监控以提供及时告警 421 421 ))) 422 -| (% style="width:174px" %)合作伙伴和供应商|(% style="width:842px" %)(((423 - *互惠协议424 - *将服务外包给多个提供商425 - *作为服务的火灾探测系统或灭火系统430 +|合作伙伴和供应商|((( 431 +1. 互惠协议 432 +1. 将服务外包给多个提供商 433 +1. 作为服务的火灾探测系统或灭火系统 426 426 ))) 427 -| (% style="width:174px" %)流程和价值流|(% style="width:842px" %)(((428 - *服务交付的手动操作和替代方法429 - *响应和恢复的计划与程序(服务连续性计划)435 +|流程和价值流|((( 436 +1. 服务交付的手动操作和替代方法 437 +1. 响应和恢复的计划与程序(服务连续性计划) 430 430 ))) 431 431 432 432 表2.6 服务连续性管理实践的四个维度 ... ... @@ -439,6 +439,7 @@ 439 439 * 效果根据风险管理原则,应评估服务连续性措施的效果,并将其与破坏性事态的预期损失进行比较。 440 440 * 效率服务连续性度量的成本应该进行评估,并与收益进行比较。通过估算实施该措施后破坏性事态发生概率的降低,并乘以发生事态会对服务提供者和客户造成的预期的影响,可以计算出收益。就成本而言,应将此价值与该措施实施的成本进行比较。这里可以使用成本效益分析。 441 441 450 + 442 442 === **2.4.3 确保认知和就绪状态** === 443 443 444 444 未经测试的恢复计划通常根本无法按预期工作。因此,测试是服务连续性管理的关键组成部分,并且是确保所选策略,已实施措施和计划切实可行的唯一方法。 ... ... @@ -457,31 +457,31 @@ 457 457 458 458 表2.7 概述了2013年。 459 459 460 -| (% style="width:92px" %)演练类型|(% style="width:426px" %)关键特征|目的461 -| (% style="width:92px" %)走查|(% style="width:426px" %)(((462 - *基于讨论的演练463 - *未加压的环境464 - *通常专注于某一特定区域进行改进469 +|演练类型|关键特征|目的 470 +|走查|((( 471 +1. 基于讨论的演练 472 +1. 未加压的环境 473 +1. 通常专注于某一特定区域进行改进 465 465 )))|((( 466 466 用于恢复团队成员首次见面 467 467 468 468 利用改进机会 469 469 ))) 470 -| (% style="width:92px" %)桌上演练|(% style="width:426px" %)(((471 - *基于一个给定场景的讨论472 - *通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练479 +|桌上演练|((( 480 +1. 基于一个给定场景的讨论 481 +1. 通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练 473 473 )))|提高对计划的了解 474 -| (% style="width:92px" %)指挥所演练|(% style="width:426px" %)(((475 - *以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应483 +|指挥所演练|((( 484 +1. 以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应 476 476 )))|测试沟通,决策和协调 477 -| (% style="width:92px" %)现场|(% style="width:426px" %)(((478 - *测试计划的最逼真的方法479 - *范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练480 - *通常包括参与的利益相关方486 +|现场|((( 487 +1. 测试计划的最逼真的方法 488 +1. 范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练 489 +1. 通常包括参与的利益相关方 481 481 )))|测试在发生破坏性事态时,达到RTO,RPO和最低目标服务水平的能力 482 -| (% style="width:92px" %)测试|(% style="width:426px" %)(((483 - *它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。484 - *依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中491 +|测试|((( 492 +1. 它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。 493 +1. 依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中 485 485 )))|当故障的风险较高时,测试服务组件的恢复 486 486 487 487 表2.7 锻炼类型 ... ... @@ -500,19 +500,19 @@ 500 500 501 501 |实践成功因素|指标示例 502 502 |制定和管理服务连续性计划|((( 503 - *具有清晰地文件化连续性要求的产品和服务的百分比504 - *文件化的服务连续性计划中(关键)产品和服务的百分比505 - *及时更新服务连续性计划512 +1. 具有清晰地文件化连续性要求的产品和服务的百分比 513 +1. 文件化的服务连续性计划中(关键)产品和服务的百分比 514 +1. 及时更新服务连续性计划 506 506 ))) 507 507 |降低服务的连续性风险|((( 508 - *RTO达成情况(实际灾难和演练)509 - *RPO达成情况(实际灾难和演练)510 - *有效连续性措施的百分比511 - *实际损失与预期损失之比517 +1. RTO达成情况(实际灾难和演练) 518 +1. RPO达成情况(实际灾难和演练) 519 +1. 有效连续性措施的百分比 520 +1. 实际损失与预期损失之比 512 512 ))) 513 513 |确保认知和就绪状态|((( 514 - *按计划进行的演练和认知活动的百分比515 - *在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比523 +1. 按计划进行的演练和认知活动的百分比 524 +1. 在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比 516 516 ))) 517 517 518 518 表2.8 实践成功因素的指标示例 ... ... @@ -563,6 +563,7 @@ 563 563 * 测试服务连续性计划 564 564 * 响应和恢复 565 565 575 + 566 566 === **3.2.1 服务连续性管理的治理** === 567 567 568 568 该流程包括表3.1中列出的活动,并将输入转换为输出。 ... ... @@ -661,24 +661,24 @@ 661 661 662 662 |关键输入|活动|关键输出 663 663 |((( 664 - *服务文档665 - *风险评估报告666 - *VBF损失的财务数据667 - *重大事件报告668 - *服务模型669 - *风险管理策略670 - *风险偏好671 - *监管要求674 +1. 服务文档 675 +1. 风险评估报告 676 +1. VBF损失的财务数据 677 +1. 重大事件报告 678 +1. 服务模型 679 +1. 风险管理策略 680 +1. 风险偏好 681 +1. 监管要求 672 672 )))|((( 673 - *VBF识别674 - *中断后果分析675 - *VBF相互依赖关系识别676 - *服务连续性要求的确定683 +1. VBF识别 684 +1. 中断后果分析 685 +1. VBF相互依赖关系识别 686 +1. 服务连续性要求的确定 677 677 )))|((( 678 - *VBF的优先级列表679 - *文件化的VBF损失产生的影响680 - *文件化的VBF相互依赖关系681 - *业务影响分析报告688 +1. VBF的优先级列表 689 +1. 文件化的VBF损失产生的影响 690 +1. 文件化的VBF相互依赖关系 691 +1. 业务影响分析报告 682 682 ))) 683 683 684 684 表3.3 业务影响分析流程的输入、活动和输出 ... ... @@ -746,19 +746,19 @@ 746 746 747 747 |关键输入|活动|关键输出 748 748 |((( 749 - *业务影响分析报告750 - *现有控件751 - *有关可用资源的信息752 - *消费者的连续性计划753 - *服务连续性策略759 +1. 业务影响分析报告 760 +1. 现有控件 761 +1. 有关可用资源的信息 762 +1. 消费者的连续性计划 763 +1. 服务连续性策略 754 754 )))|((( 755 - *服务连续性策略制定756 - *服务连续性计划制定757 - *服务连续性计划的初始测试765 +1. 服务连续性策略制定 766 +1. 服务连续性计划制定 767 +1. 服务连续性计划的初始测试 758 758 )))|((( 759 - *新的和更新的控件760 - *服务连续性策略761 - *服务连续性计划769 +1. 新的和更新的控件 770 +1. 服务连续性策略 771 +1. 服务连续性计划 762 762 ))) 763 763 764 764 表3.5 制定和维护服务连续性计划流程的输入,活动和输出 ... ... @@ -776,18 +776,18 @@ 776 776 777 777 表3.6 进一步概述了这些活动。 778 778 779 -| (% style="width:147px" %)活动|(% style="width:621px" %)描述780 -| (% style="width:147px" %)服务连续性策略制定|(% style="width:621px" %)(((789 +|活动|描述 790 +|服务连续性策略制定|((( 781 781 基于BIA 报告,服务提供者应该确定一套适当的且具有成本效益的服务连续性策略集。 782 782 783 783 对于影响更早,影响更大的流程和服务,应采取更多的预防措施。对于影响较低且需要较长时间开发的流程和服务,应更加重视恢复措施。 784 784 ))) 785 -| (% style="width:147px" %)服务连续性计划制定|(% style="width:621px" %)(((795 +|服务连续性计划制定|((( 786 786 基于服务连续性政策和策略,服务提供者应该制定和维护服务连续性计划。 787 787 788 788 如果服务或恢复团队成员发生变化,则必须更新计划。计划也可以在演练或实际恢复之后更新。 789 789 ))) 790 -| (% style="width:147px" %)服务连续性计划的初始测试|(% style="width:621px" %)发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。800 +|服务连续性计划的初始测试|发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。 791 791 792 792 表3.6 制定和维护服务连续性计划流程的活动 793 793 ... ... @@ -798,16 +798,16 @@ 798 798 799 799 |关键输入|活动|关键输出 800 800 |((( 801 - *认知和演练方案802 - *服务连续性计划811 +1. 认知和演练方案 812 +1. 服务连续性计划 803 803 )))|((( 804 - *进行演练805 - *服务连续性审计814 +1. 进行演练 815 +1. 服务连续性审计 806 806 )))|((( 807 - *演练报告808 - *新的和更新的控件的要求809 - *策略或计划的变更请求810 - *审计报告817 +1. 演练报告 818 +1. 新的和更新的控件的要求 819 +1. 策略或计划的变更请求 820 +1. 审计报告 811 811 ))) 812 812 813 813 表3.7 测试服务连续性计划流程的输入、活动和输出 ... ... @@ -848,15 +848,15 @@ 848 848 849 849 |关键输入|活动|关键输出 850 850 |((( 851 - *服务连续性计划852 - *事件记录861 +1. 服务连续性计划 862 +1. 事件记录 853 853 )))|((( 854 - *调用855 - *执行服务连续性计划864 +1. 调用 865 +1. 执行服务连续性计划 856 856 )))|((( 857 - *恢复报告858 - *新的和更新的控件的要求859 - *变更计划的请求867 +1. 恢复报告 868 +1. 新的和更新的控件的要求 869 +1. 变更计划的请求 860 860 ))) 861 861 862 862 表3.9 响应和恢复流程的输入、活动和输出 ... ... @@ -925,7 +925,6 @@ 925 925 926 926 角色是在流程和活动的背景中描述的。每个角色都具有基于表4.1中所示模型的一个能力简介的特征。 927 927 928 - 929 929 表4.1 能力代码和简介 930 930 931 931 |能力代码|能力类型(活动和技能) ... ... @@ -935,6 +935,7 @@ 935 935 |M|**方法和技术专家 **设计和实施工作技术,记录程序,咨询流程,工作分析和持续改进 936 936 |T|**技术专家 **提供技术(IT)专业知识并实施基于专业知识的任务 937 937 947 + 938 938 表4.2 中列出了服务连续性管理实践涉及的角色示例,以及相关的能力简介和特定技能。 939 939 940 940 |流程活动|(% colspan="2" %)负责角色|(% colspan="2" %)能力类型|具体技能 ... ... @@ -1084,10 +1084,10 @@ 1084 1084 1085 1085 在恢复过程中,组织结构通常基于连续性计划的级别。表4.3概述了用于响应和恢复的组织结构级别。 1086 1086 1087 -|连续性计划的层次| (% style="width:77px" %)组织层次|(% style="width:602px" %)描述1088 -|战略| (% style="width:77px" %)行政级别|(% style="width:602px" %)这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。1089 -|战术| (% style="width:77px" %)协调级别|(% style="width:602px" %)通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。1090 -|运行| (% style="width:77px" %)专家级|(% style="width:602px" %)一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。1097 +|连续性计划的层次|组织层次|描述 1098 +|战略|行政级别|这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。 1099 +|战术|协调级别|通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。 1100 +|运行|专家级|一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。 1091 1091 1092 1092 表4.3 用于响应和恢复的组织结构 1093 1093 ... ... @@ -1117,14 +1117,14 @@ 1117 1117 1118 1118 尤其是在大型组织中,服务连续性实践应该是自动化的。在可行且有效的地方,可能涉及表5.1中概述的解决方案。 1119 1119 1120 -|(% style="width:89px" %)流程活动|(% colspan="4" style="width:2 93px" %)自动化手段|(% colspan="3" style="width:442px" %)关键功能|(% colspan="3"style="width:132px"%)对实践有效性的影响1130 +|(% style="width:89px" %)流程活动|(% colspan="4" style="width:123px" %)自动化手段|(% colspan="3" style="width:420px" %)关键功能|(% colspan="3" %)对实践有效性的影响 1121 1121 |(% colspan="11" %)服务连续性管理流程的治理 1122 1122 |(% style="width:89px" %)((( 1123 1123 范围的定义 1124 1124 1125 1125 策略设置 1126 -)))|(% colspan="4" style="width:2 93px" %)知识管理工具和文档存储库|(% colspan="3" style="width:442px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3"style="width:132px"%)低1127 -|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:2 93px" %)业务连续性计划工具|(% colspan="3" style="width:442px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3"style="width:132px"%)中1136 +)))|(% colspan="4" style="width:123px" %)知识管理工具和文档存储库|(% colspan="3" style="width:420px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3" %)低 1137 +|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:123px" %)业务连续性计划工具|(% colspan="3" style="width:420px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3" %)中 1128 1128 |(% colspan="11" %)业务影响分析流程 1129 1129 |(% colspan="3" style="width:105px" %)VBF识别|(% colspan="3" style="width:164px" %)服务目录,CMDB,BPM工具|(% colspan="3" style="width:470px" %)为了识别VBF,服务分析人员应有权访问有关服务组件和操作的信息。BPM工具可以提供消费者的流程以及服务支持的操作的有关信息|(% colspan="2" %)高 1130 1130 |(% colspan="3" style="width:105px" %)中断后果分析|(% colspan="3" style="width:164px" %)(((