从版本< 14.1 >
由superadmin编辑
在2021/02/20, 14:52上
到版本
由superadmin编辑
在2021/02/21, 11:34上
< >
修改评论 该版本没有评论

Summary

Details

Icon Page properties
标题
... ... @@ -1,1 +1,1 @@
1 -14 服务连续性管理
1 +14 服务连续性管理实践
Content
... ... @@ -1,27 +1,23 @@
1 1  {{box cssClass="floatinginfobox" title="**Contents**"}}
2 2  {{toc/}}
3 3  {{/box}}
4 -(((
5 -= =
6 6  
7 -
8 -
9 -
10 -
5 +(((
11 11  
12 12  )))
13 -)))
14 14  
15 15  需要下载 **ITIL 4 服务连续性管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“服务连续性”即可。
16 16  
17 -[[image:file:///C:/Users/19805/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png]] ​[[image:微信截图_20210206234644.png]]
11 + ​[[image:微信截图_20210206234644.png]]
18 18  
19 19  **申明:**
20 20  
21 21  本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。
22 22  
17 +
23 23  请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。
24 24  
20 +
25 25  翻译:李天池  审校:张宏伟  审核:谢帅
26 26  
27 27  
... ... @@ -39,7 +39,6 @@
39 39  * 对本实践的合作伙伴和供应商的考虑
40 40  
41 41  
42 -
43 43  == **1.1 ITIL 4资格认证计划** ==
44 44  
45 45  本文档中的部分内容可作为以下教学大纲的一部分以供检查:
... ... @@ -180,7 +180,6 @@
180 180  * 中断期间应能够访问服务的有限的用户数量或特定用户组
181 181  * 中断期间用户应能够处理的单位时间段内有限的交易数量。
182 182  
183 -
184 184  === **2.2.5  业务影响分析** ===
185 185  
186 186  |(((
... ... @@ -198,7 +198,6 @@
198 198  * 设置优先级时间范围以在明确规定的最低可接受水平上恢复这些活动,考虑到在这时间内不恢复它们,带来的影响将变得不可接受
199 199  * 确定这些活动的依赖关系和支持资源,包括供应商,外包合作伙伴,以及其他相关利益方。
200 200  
201 -
202 202  === **2.2.6  服务连续性/ 灾难恢复计划** ===
203 203  
204 204  |(((
... ... @@ -248,7 +248,6 @@
248 248  |实施风险缓解措施并更改IT基础设施,以确保弹性|项目管理, 变更控制
249 249  |管理并实施持续改进|持续改进
250 250  
251 -
252 252  === **2.3.1  可用性与连续性之间的界线** ===
253 253  
254 254  服务的连续性和可用性管理的实践之间的界限是不明显的。两种做法都涉及风险的概念,并致力于识别和准备应对可能威胁并导致服务不能运转的事件。对于这两种实践,都需要了解VBF和风险评估或服务故障的BIA。最终,两种做法都确保了组织的抗故障能力。
... ... @@ -289,7 +289,6 @@
289 289  服务提供者必须承诺服务连续性计划,以便继续服务的交付。
290 290  )))
291 291  
292 -
293 293  === **2.3.3 服务连续性实践在管理风险时的角色** ===
294 294  
295 295  风险的概念是服务连续性管理实践的核心。该实践通常关注于减轻无法完全防止的高影响,低概率风险。
... ... @@ -349,8 +349,8 @@
349 349  
350 350  服务连续性计划根据服务提供者的类型和组织的规模,其结构的复杂度可能会或多或少。表2.4 概述了一些常见的结构。
351 351  
352 -| |小型组织|大型组织
353 -|内部服务提供商|(((
343 +|(% style="width:122px" %) |(% style="width:290px" %)小型组织|大型组织
344 +|(% style="width:122px" %)内部服务提供商|(% style="width:290px" %)(((
354 354  在小型组织的IT部门中,可能没有任何服务连续性计划。所有连续性安排都可以作为业务连续性管理的一部分进行管理。
355 355  
356 356  特定的IT服务连续性活动可以作为事件管理实践的一部分执行。
... ... @@ -361,7 +361,7 @@
361 361  
362 362  操作层:大量的用于特定恢复活动的详细步骤(例如,从备份中恢复应用程序数据)。其他部门可能会有自己的特定操作说明,作为连续性计划的一部分。
363 363  )))
364 -|外部服务提供商|所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。
355 +|(% style="width:122px" %)外部服务提供商|(% style="width:290px" %)所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。
365 365  
366 366  表2.4 连续性计划的结构选项
367 367  
... ... @@ -368,9 +368,9 @@
368 368  
369 369  服务连续性计划应涵盖表2.5中概述的灾难发生之后的各个阶段。
370 370  
371 -|阶段|响应|恢复|复原
372 -|计划|响应计划|恢复计划|恢复正常运行计划
373 -|内容|(((
362 +|(% style="width:79px" %)阶段|(% style="width:503px" %)响应|恢复|复原
363 +|(% style="width:79px" %)计划|(% style="width:503px" %)响应计划|恢复计划|恢复正常运行计划
364 +|(% style="width:79px" %)内容|(% style="width:503px" %)(((
374 374  应触发服务连续性计划的事件和场景
375 375  
376 376  危机管理组联系人
... ... @@ -414,27 +414,27 @@
414 414  
415 415  表2.6 中概述的服务连续性选项可以作为总体风险缓解计划的一部分来设计和实现。
416 416  
417 -|服务管理维度|服务连续性措施
418 -|组织和人员|(((
419 -1. 在灾难期间的人员管理
420 -1. 使用替代站点和设施
408 +|(% style="width:174px" %)服务管理维度|(% style="width:842px" %)服务连续性措施
409 +|(% style="width:174px" %)组织和人员|(% style="width:842px" %)(((
410 +* 在灾难期间的人员管理
411 +* 使用替代站点和设施
421 421  )))
422 -|信息和技术|(((
423 -1. 物理安全
424 -1. 弹性电信网络
425 -1. 运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性
426 -1. 数据备份
427 -1. 容错应用程序
428 -1. 监控以提供及时告警
413 +|(% style="width:174px" %)信息和技术|(% style="width:842px" %)(((
414 +* 物理安全
415 +* 弹性电信网络
416 +* 运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性
417 +* 数据备份
418 +* 容错应用程序
419 +* 监控以提供及时告警
429 429  )))
430 -|合作伙伴和供应商|(((
431 -1. 互惠协议
432 -1. 将服务外包给多个提供商
433 -1. 作为服务的火灾探测系统或灭火系统
421 +|(% style="width:174px" %)合作伙伴和供应商|(% style="width:842px" %)(((
422 +* 互惠协议
423 +* 将服务外包给多个提供商
424 +* 作为服务的火灾探测系统或灭火系统
434 434  )))
435 -|流程和价值流|(((
436 -1. 服务交付的手动操作和替代方法
437 -1. 响应和恢复的计划与程序(服务连续性计划)
426 +|(% style="width:174px" %)流程和价值流|(% style="width:842px" %)(((
427 +* 服务交付的手动操作和替代方法
428 +* 响应和恢复的计划与程序(服务连续性计划)
438 438  )))
439 439  
440 440  表2.6 服务连续性管理实践的四个维度
... ... @@ -448,6 +448,7 @@
448 448  * 效率服务连续性度量的成本应该进行评估,并与收益进行比较。通过估算实施该措施后破坏性事态发生概率的降低,并乘以发生事态会对服务提供者和客户造成的预期的影响,可以计算出收益。就成本而言,应将此价值与该措施实施的成本进行比较。这里可以使用成本效益分析。
449 449  
450 450  
442 +
451 451  === **2.4.3 确保认知和就绪状态** ===
452 452  
453 453  未经测试的恢复计划通常根本无法按预期工作。因此,测试是服务连续性管理的关键组成部分,并且是确保所选策略,已实施措施和计划切实可行的唯一方法。
... ... @@ -466,31 +466,31 @@
466 466  
467 467  表2.7 概述了2013年。
468 468  
469 -|演练类型|关键特征|目的
470 -|走查|(((
471 -1. 基于讨论的演练
472 -1. 未加压的环境
473 -1. 通常专注于某一特定区域进行改进
461 +|(% style="width:92px" %)演练类型|(% style="width:426px" %)关键特征|目的
462 +|(% style="width:92px" %)走查|(% style="width:426px" %)(((
463 +* 基于讨论的演练
464 +* 未加压的环境
465 +* 通常专注于某一特定区域进行改进
474 474  )))|(((
475 475  用于恢复团队成员首次见面
476 476  
477 477  利用改进机会
478 478  )))
479 -|桌上演练|(((
480 -1. 基于一个给定场景的讨论
481 -1. 通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练
471 +|(% style="width:92px" %)桌上演练|(% style="width:426px" %)(((
472 +* 基于一个给定场景的讨论
473 +* 通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练
482 482  )))|提高对计划的了解
483 -|指挥所演练|(((
484 -1. 以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应
475 +|(% style="width:92px" %)指挥所演练|(% style="width:426px" %)(((
476 +* 以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应
485 485  )))|测试沟通,决策和协调
486 -|现场|(((
487 -1. 测试计划的最逼真的方法
488 -1. 范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练
489 -1. 通常包括参与的利益相关方
478 +|(% style="width:92px" %)现场|(% style="width:426px" %)(((
479 +* 测试计划的最逼真的方法
480 +* 范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练
481 +* 通常包括参与的利益相关方
490 490  )))|测试在发生破坏性事态时,达到RTO,RPO和最低目标服务水平的能力
491 -|测试|(((
492 -1. 它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。
493 -1. 依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中
483 +|(% style="width:92px" %)测试|(% style="width:426px" %)(((
484 +* 它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。
485 +* 依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中
494 494  )))|当故障的风险较高时,测试服务组件的恢复
495 495  
496 496  表2.7 锻炼类型
... ... @@ -509,19 +509,19 @@
509 509  
510 510  |实践成功因素|指标示例
511 511  |制定和管理服务连续性计划|(((
512 -1. 具有清晰地文件化连续性要求的产品和服务的百分比
513 -1. 文件化的服务连续性计划中(关键)产品和服务的百分比
514 -1. 及时更新服务连续性计划
504 +* 具有清晰地文件化连续性要求的产品和服务的百分比
505 +* 文件化的服务连续性计划中(关键)产品和服务的百分比
506 +* 及时更新服务连续性计划
515 515  )))
516 516  |降低服务的连续性风险|(((
517 -1. RTO达成情况(实际灾难和演练)
518 -1. RPO达成情况(实际灾难和演练)
519 -1. 有效连续性措施的百分比
520 -1. 实际损失与预期损失之比
509 +* RTO达成情况(实际灾难和演练)
510 +* RPO达成情况(实际灾难和演练)
511 +* 有效连续性措施的百分比
512 +* 实际损失与预期损失之比
521 521  )))
522 522  |确保认知和就绪状态|(((
523 -1. 按计划进行的演练和认知活动的百分比
524 -1. 在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比
515 +* 按计划进行的演练和认知活动的百分比
516 +* 在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比
525 525  )))
526 526  
527 527  表2.8 实践成功因素的指标示例
... ... @@ -573,6 +573,7 @@
573 573  * 响应和恢复
574 574  
575 575  
568 +
576 576  === **3.2.1  服务连续性管理的治理** ===
577 577  
578 578  该流程包括表3.1中列出的活动,并将输入转换为输出。
... ... @@ -671,24 +671,24 @@
671 671  
672 672  |关键输入|活动|关键输出
673 673  |(((
674 -1. 服务文档
675 -1. 风险评估报告
676 -1. VBF损失的财务数据
677 -1. 重大事件报告
678 -1. 服务模型
679 -1. 风险管理策略
680 -1. 风险偏好
681 -1. 监管要求
667 +* 服务文档
668 +* 风险评估报告
669 +* VBF损失的财务数据
670 +* 重大事件报告
671 +* 服务模型
672 +* 风险管理策略
673 +* 风险偏好
674 +* 监管要求
682 682  )))|(((
683 -1. VBF识别
684 -1. 中断后果分析
685 -1. VBF相互依赖关系识别
686 -1. 服务连续性要求的确定
676 +* VBF识别
677 +* 中断后果分析
678 +* VBF相互依赖关系识别
679 +* 服务连续性要求的确定
687 687  )))|(((
688 -1. VBF的优先级列表
689 -1. 文件化的VBF损失产生的影响
690 -1. 文件化的VBF相互依赖关系
691 -1. 业务影响分析报告
681 +* VBF的优先级列表
682 +* 文件化的VBF损失产生的影响
683 +* 文件化的VBF相互依赖关系
684 +* 业务影响分析报告
692 692  )))
693 693  
694 694  表3.3 业务影响分析流程的输入、活动和输出
... ... @@ -750,25 +750,25 @@
750 750  表3.4 业务影响分析流程的活动
751 751  
752 752  
753 -=== **3.3.2  制定和维护服务连续性计划** ===
746 +=== **3.3.3  制定和维护服务连续性计划** ===
754 754  
755 755  该流程包括表3.5 中列出的活动,并将输入转换为输出。
756 756  
757 757  |关键输入|活动|关键输出
758 758  |(((
759 -1. 业务影响分析报告
760 -1. 现有控件
761 -1. 有关可用资源的信息
762 -1. 消费者的连续性计划
763 -1. 服务连续性策略
752 +* 业务影响分析报告
753 +* 现有控件
754 +* 有关可用资源的信息
755 +* 消费者的连续性计划
756 +* 服务连续性策略
764 764  )))|(((
765 -1. 服务连续性策略制定
766 -1. 服务连续性计划制定
767 -1. 服务连续性计划的初始测试
758 +* 服务连续性策略制定
759 +* 服务连续性计划制定
760 +* 服务连续性计划的初始测试
768 768  )))|(((
769 -1. 新的和更新的控件
770 -1. 服务连续性策略
771 -1. 服务连续性计划
762 +* 新的和更新的控件
763 +* 服务连续性策略
764 +* 服务连续性计划
772 772  )))
773 773  
774 774  表3.5 制定和维护服务连续性计划流程的输入,活动和输出
... ... @@ -786,38 +786,38 @@
786 786  
787 787  表3.6 进一步概述了这些活动。
788 788  
789 -|活动|描述
790 -|服务连续性策略制定|(((
782 +|(% style="width:147px" %)活动|(% style="width:621px" %)描述
783 +|(% style="width:147px" %)服务连续性策略制定|(% style="width:621px" %)(((
791 791  基于BIA 报告,服务提供者应该确定一套适当的且具有成本效益的服务连续性策略集。
792 792  
793 793  对于影响更早,影响更大的流程和服务,应采取更多的预防措施。对于影响较低且需要较长时间开发的流程和服务,应更加重视恢复措施。
794 794  )))
795 -|服务连续性计划制定|(((
788 +|(% style="width:147px" %)服务连续性计划制定|(% style="width:621px" %)(((
796 796  基于服务连续性政策和策略,服务提供者应该制定和维护服务连续性计划。
797 797  
798 798  如果服务或恢复团队成员发生变化,则必须更新计划。计划也可以在演练或实际恢复之后更新。
799 799  )))
800 -|服务连续性计划的初始测试|发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。
793 +|(% style="width:147px" %)服务连续性计划的初始测试|(% style="width:621px" %)发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。
801 801  
802 802  表3.6 制定和维护服务连续性计划流程的活动
803 803  
804 804  
805 -=== **3.3.3  测试服务连续性计划** ===
798 +=== **3.3.4  测试服务连续性计划** ===
806 806  
807 807  该流程包括表3.7 中列出的活动,并将输入转换为输出。
808 808  
809 809  |关键输入|活动|关键输出
810 810  |(((
811 -1. 认知和演练方案
812 -1. 服务连续性计划
804 +* 认知和演练方案
805 +* 服务连续性计划
813 813  )))|(((
814 -1. 进行演练
815 -1. 服务连续性审计
807 +* 进行演练
808 +* 服务连续性审计
816 816  )))|(((
817 -1. 演练报告
818 -1. 新的和更新的控件的要求
819 -1. 策略或计划的变更请求
820 -1. 审计报告
810 +* 演练报告
811 +* 新的和更新的控件的要求
812 +* 策略或计划的变更请求
813 +* 审计报告
821 821  )))
822 822  
823 823  表3.7 测试服务连续性计划流程的输入、活动和输出
... ... @@ -852,21 +852,21 @@
852 852  表3.8测试服务连续性计划流程的活动
853 853  
854 854  
855 -=== **3.3.4  响应和恢复** ===
848 +=== **3.3.5  响应和恢复** ===
856 856  
857 857  该流程包括表3.9 中所述的活动,并将输入转换为输出。
858 858  
859 859  |关键输入|活动|关键输出
860 860  |(((
861 -1. 服务连续性计划
862 -1. 事件记录
854 +* 服务连续性计划
855 +* 事件记录
863 863  )))|(((
864 -1. 调用
865 -1. 执行服务连续性计划
857 +* 调用
858 +* 执行服务连续性计划
866 866  )))|(((
867 -1. 恢复报告
868 -1. 新的和更新的控件的要求
869 -1. 变更计划的请求
860 +* 恢复报告
861 +* 新的和更新的控件的要求
862 +* 变更计划的请求
870 870  )))
871 871  
872 872  表3.9 响应和恢复流程的输入、活动和输出
... ... @@ -935,6 +935,7 @@
935 935  
936 936  角色是在流程和活动的背景中描述的。每个角色都具有基于表4.1中所示模型的一个能力简介的特征。
937 937  
931 +
938 938  表4.1 能力代码和简介
939 939  
940 940  |能力代码|能力类型(活动和技能)
... ... @@ -944,7 +944,6 @@
944 944  |M|**方法和技术专家 **设计和实施工作技术,记录程序,咨询流程,工作分析和持续改进
945 945  |T|**技术专家 **提供技术(IT)专业知识并实施基于专业知识的任务
946 946  
947 -
948 948  表4.2 中列出了服务连续性管理实践涉及的角色示例,以及相关的能力简介和特定技能。
949 949  
950 950  |流程活动|(% colspan="2" %)负责角色|(% colspan="2" %)能力类型|具体技能
... ... @@ -1094,10 +1094,10 @@
1094 1094  
1095 1095  在恢复过程中,组织结构通常基于连续性计划的级别。表4.3概述了用于响应和恢复的组织结构级别。
1096 1096  
1097 -|连续性计划的层次|组织层次|描述
1098 -|战略|行政级别|这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。
1099 -|战术|协调级别|通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。
1100 -|运行|专家级|一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。
1090 +|连续性计划的层次|(% style="width:77px" %)组织层次|(% style="width:602px" %)描述
1091 +|战略|(% style="width:77px" %)行政级别|(% style="width:602px" %)这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。
1092 +|战术|(% style="width:77px" %)协调级别|(% style="width:602px" %)通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。
1093 +|运行|(% style="width:77px" %)专家级|(% style="width:602px" %)一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。
1101 1101  
1102 1102  表4.3 用于响应和恢复的组织结构
1103 1103  
... ... @@ -1127,14 +1127,14 @@
1127 1127  
1128 1128  尤其是在大型组织中,服务连续性实践应该是自动化的。在可行且有效的地方,可能涉及表5.1中概述的解决方案。
1129 1129  
1130 -|(% style="width:89px" %)流程活动|(% colspan="4" style="width:123px" %)自动化手段|(% colspan="3" style="width:420px" %)关键功能|(% colspan="3" %)对实践有效性的影响
1123 +|(% style="width:89px" %)流程活动|(% colspan="4" style="width:293px" %)自动化手段|(% colspan="3" style="width:442px" %)关键功能|(% colspan="3" style="width:132px" %)对实践有效性的影响
1131 1131  |(% colspan="11" %)服务连续性管理流程的治理
1132 1132  |(% style="width:89px" %)(((
1133 1133  范围的定义
1134 1134  
1135 1135  策略设置
1136 -)))|(% colspan="4" style="width:123px" %)知识管理工具和文档存储库|(% colspan="3" style="width:420px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3" %)低
1137 -|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:123px" %)业务连续性计划工具|(% colspan="3" style="width:420px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3" %)中
1129 +)))|(% colspan="4" style="width:293px" %)知识管理工具和文档存储库|(% colspan="3" style="width:442px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3" style="width:132px" %)低
1130 +|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:293px" %)业务连续性计划工具|(% colspan="3" style="width:442px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3" style="width:132px" %)中
1138 1138  |(% colspan="11" %)业务影响分析流程
1139 1139  |(% colspan="3" style="width:105px" %)VBF识别|(% colspan="3" style="width:164px" %)服务目录,CMDB,BPM工具|(% colspan="3" style="width:470px" %)为了识别VBF,服务分析人员应有权访问有关服务组件和操作的信息。BPM工具可以提供消费者的流程以及服务支持的操作的有关信息|(% colspan="2" %)高
1140 1140  |(% colspan="3" style="width:105px" %)中断后果分析|(% colspan="3" style="width:164px" %)(((
深圳市艾拓先锋企业管理咨询有限公司