Changes for page 服务管理实践 - 14 服务连续性
Last modified by superadmin on 2024/12/25, 15:40
Summary
Details
- Page properties
-
- Title
-
... ... @@ -1,1 +1,1 @@ 1 -14 服务连续性管理 实践1 +14 服务连续性管理(尚未发布) - Content
-
... ... @@ -1,23 +1,27 @@ 1 -{{box cssClass="floatinginfobox" title="**Contents**"}} 2 -{{toc/}} 3 -{{/box}} 4 - 1 +(% class="jumbotron" %) 5 5 ((( 3 +(% class="container" %) 4 +((( 5 += = 6 + 7 + 8 + 9 + 10 + 6 6 7 7 ))) 13 +))) 8 8 9 9 需要下载 **ITIL 4 服务连续性管理实践【中文】**pdf版全文,请关注微信公众号itilxf ,并回复“服务连续性”即可。 10 10 11 - [[image:微信截图_20210206234644.png]] 17 +[[image:file:///C:/Users/19805/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png]] [[image:微信截图_20210206234644.png]] 12 12 13 13 **申明:** 14 14 15 15 本系列ITIL 4实践中文版本由ITIL先锋论坛专家委员会组织翻译,国内众多从事ITIL理论推广及落地实践的专家们参与,需要下载最新翻译版本请关注微信公众号:ITILXF,也可访问ITIL4中文知识库网站:itil4hub.cn。 16 16 17 - 18 18 请注意,ITIL先锋论坛专家团队仅仅只是进行了这些著作的语种转换工作,我们并不拥有包括原著以及中文发行文件的任何版权,所有版权均为Axoles持有,读者在使用这些文件(含本中文翻译版本)时需完全遵守Axoles 和 TSO所申明的所有版权要求。 19 19 20 - 21 21 翻译:李天池 审校:张宏伟 审核:谢帅 22 22 23 23 ... ... @@ -35,6 +35,7 @@ 35 35 * 对本实践的合作伙伴和供应商的考虑 36 36 37 37 42 + 38 38 == **1.1 ITIL 4资格认证计划** == 39 39 40 40 本文档中的部分内容可作为以下教学大纲的一部分以供检查: ... ... @@ -175,6 +175,7 @@ 175 175 * 中断期间应能够访问服务的有限的用户数量或特定用户组 176 176 * 中断期间用户应能够处理的单位时间段内有限的交易数量。 177 177 183 + 178 178 === **2.2.5 业务影响分析** === 179 179 180 180 |((( ... ... @@ -192,6 +192,7 @@ 192 192 * 设置优先级时间范围以在明确规定的最低可接受水平上恢复这些活动,考虑到在这时间内不恢复它们,带来的影响将变得不可接受 193 193 * 确定这些活动的依赖关系和支持资源,包括供应商,外包合作伙伴,以及其他相关利益方。 194 194 201 + 195 195 === **2.2.6 服务连续性/ 灾难恢复计划** === 196 196 197 197 |((( ... ... @@ -241,6 +241,7 @@ 241 241 |实施风险缓解措施并更改IT基础设施,以确保弹性|项目管理, 变更控制 242 242 |管理并实施持续改进|持续改进 243 243 251 + 244 244 === **2.3.1 可用性与连续性之间的界线** === 245 245 246 246 服务的连续性和可用性管理的实践之间的界限是不明显的。两种做法都涉及风险的概念,并致力于识别和准备应对可能威胁并导致服务不能运转的事件。对于这两种实践,都需要了解VBF和风险评估或服务故障的BIA。最终,两种做法都确保了组织的抗故障能力。 ... ... @@ -281,6 +281,7 @@ 281 281 服务提供者必须承诺服务连续性计划,以便继续服务的交付。 282 282 ))) 283 283 292 + 284 284 === **2.3.3 服务连续性实践在管理风险时的角色** === 285 285 286 286 风险的概念是服务连续性管理实践的核心。该实践通常关注于减轻无法完全防止的高影响,低概率风险。 ... ... @@ -340,8 +340,8 @@ 340 340 341 341 服务连续性计划根据服务提供者的类型和组织的规模,其结构的复杂度可能会或多或少。表2.4 概述了一些常见的结构。 342 342 343 -| (%style="width:122px" %)|(% style="width:290px" %)小型组织|大型组织344 -| (% style="width:122px" %)内部服务提供商|(% style="width:290px" %)(((352 +| |小型组织|大型组织 353 +|内部服务提供商|((( 345 345 在小型组织的IT部门中,可能没有任何服务连续性计划。所有连续性安排都可以作为业务连续性管理的一部分进行管理。 346 346 347 347 特定的IT服务连续性活动可以作为事件管理实践的一部分执行。 ... ... @@ -352,7 +352,7 @@ 352 352 353 353 操作层:大量的用于特定恢复活动的详细步骤(例如,从备份中恢复应用程序数据)。其他部门可能会有自己的特定操作说明,作为连续性计划的一部分。 354 354 ))) 355 -| (% style="width:122px" %)外部服务提供商|(% style="width:290px" %)所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。364 +|外部服务提供商|所有层次(战略,战术,运行的)都可以作为一个计划实施,而一个团队则负责响应和恢复的各个方面。|连续性计划级别的描述与上面类似,但是服务提供者对所有级别负责。 356 356 357 357 表2.4 连续性计划的结构选项 358 358 ... ... @@ -359,9 +359,9 @@ 359 359 360 360 服务连续性计划应涵盖表2.5中概述的灾难发生之后的各个阶段。 361 361 362 -| (% style="width:79px" %)阶段|(% style="width:503px" %)响应|恢复|复原363 -| (% style="width:79px" %)计划|(% style="width:503px" %)响应计划|恢复计划|恢复正常运行计划364 -| (% style="width:79px" %)内容|(% style="width:503px" %)(((371 +|阶段|响应|恢复|复原 372 +|计划|响应计划|恢复计划|恢复正常运行计划 373 +|内容|((( 365 365 应触发服务连续性计划的事件和场景 366 366 367 367 危机管理组联系人 ... ... @@ -405,27 +405,27 @@ 405 405 406 406 表2.6 中概述的服务连续性选项可以作为总体风险缓解计划的一部分来设计和实现。 407 407 408 -| (% style="width:174px" %)服务管理维度|(% style="width:842px" %)服务连续性措施409 -| (% style="width:174px" %)组织和人员|(% style="width:842px" %)(((410 - *在灾难期间的人员管理411 - *使用替代站点和设施417 +|服务管理维度|服务连续性措施 418 +|组织和人员|((( 419 +1. 在灾难期间的人员管理 420 +1. 使用替代站点和设施 412 412 ))) 413 -| (% style="width:174px" %)信息和技术|(% style="width:842px" %)(((414 - *物理安全415 - *弹性电信网络416 - *运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性417 - *数据备份418 - *容错应用程序419 - *监控以提供及时告警422 +|信息和技术|((( 423 +1. 物理安全 424 +1. 弹性电信网络 425 +1. 运维中的数据保护:使用RAID阵列,SAN等来确保数据的可用性 426 +1. 数据备份 427 +1. 容错应用程序 428 +1. 监控以提供及时告警 420 420 ))) 421 -| (% style="width:174px" %)合作伙伴和供应商|(% style="width:842px" %)(((422 - *互惠协议423 - *将服务外包给多个提供商424 - *作为服务的火灾探测系统或灭火系统430 +|合作伙伴和供应商|((( 431 +1. 互惠协议 432 +1. 将服务外包给多个提供商 433 +1. 作为服务的火灾探测系统或灭火系统 425 425 ))) 426 -| (% style="width:174px" %)流程和价值流|(% style="width:842px" %)(((427 - *服务交付的手动操作和替代方法428 - *响应和恢复的计划与程序(服务连续性计划)435 +|流程和价值流|((( 436 +1. 服务交付的手动操作和替代方法 437 +1. 响应和恢复的计划与程序(服务连续性计划) 429 429 ))) 430 430 431 431 表2.6 服务连续性管理实践的四个维度 ... ... @@ -439,7 +439,6 @@ 439 439 * 效率服务连续性度量的成本应该进行评估,并与收益进行比较。通过估算实施该措施后破坏性事态发生概率的降低,并乘以发生事态会对服务提供者和客户造成的预期的影响,可以计算出收益。就成本而言,应将此价值与该措施实施的成本进行比较。这里可以使用成本效益分析。 440 440 441 441 442 - 443 443 === **2.4.3 确保认知和就绪状态** === 444 444 445 445 未经测试的恢复计划通常根本无法按预期工作。因此,测试是服务连续性管理的关键组成部分,并且是确保所选策略,已实施措施和计划切实可行的唯一方法。 ... ... @@ -458,31 +458,31 @@ 458 458 459 459 表2.7 概述了2013年。 460 460 461 -| (% style="width:92px" %)演练类型|(% style="width:426px" %)关键特征|目的462 -| (% style="width:92px" %)走查|(% style="width:426px" %)(((463 - *基于讨论的演练464 - *未加压的环境465 - *通常专注于某一特定区域进行改进469 +|演练类型|关键特征|目的 470 +|走查|((( 471 +1. 基于讨论的演练 472 +1. 未加压的环境 473 +1. 通常专注于某一特定区域进行改进 466 466 )))|((( 467 467 用于恢复团队成员首次见面 468 468 469 469 利用改进机会 470 470 ))) 471 -| (% style="width:92px" %)桌上演练|(% style="width:426px" %)(((472 - *基于一个给定场景的讨论473 - *通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练479 +|桌上演练|((( 480 +1. 基于一个给定场景的讨论 481 +1. 通常实时运行,但可以包含“时间跳跃”以使得场景的不同阶段都受到演练 474 474 )))|提高对计划的了解 475 -| (% style="width:92px" %)指挥所演练|(% style="width:426px" %)(((476 - *以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应483 +|指挥所演练|((( 484 +1. 以模拟真实事件的方式为恢复团队成员提供信息,并邀请他们做出回应 477 477 )))|测试沟通,决策和协调 478 -| (% style="width:92px" %)现场|(% style="width:426px" %)(((479 - *测试计划的最逼真的方法480 - *范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练481 - *通常包括参与的利益相关方486 +|现场|((( 487 +1. 测试计划的最逼真的方法 488 +1. 范围可以从一个组件的恢复的小型排练,到整个服务或组织的恢复的全面排练 489 +1. 通常包括参与的利益相关方 482 482 )))|测试在发生破坏性事态时,达到RTO,RPO和最低目标服务水平的能力 483 -| (% style="width:92px" %)测试|(% style="width:426px" %)(((484 - *它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。485 - *依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中491 +|测试|((( 492 +1. 它通常应用于特定的硬件或软件,例如从备份恢复应用程序数据。 493 +1. 依照ISO 22301,测试是一种独特类型的演练,它包含了一个期望,就是:演练的(一个或多个)目标的成功或失败要素正在计划中 486 486 )))|当故障的风险较高时,测试服务组件的恢复 487 487 488 488 表2.7 锻炼类型 ... ... @@ -501,19 +501,19 @@ 501 501 502 502 |实践成功因素|指标示例 503 503 |制定和管理服务连续性计划|((( 504 - *具有清晰地文件化连续性要求的产品和服务的百分比505 - *文件化的服务连续性计划中(关键)产品和服务的百分比506 - *及时更新服务连续性计划512 +1. 具有清晰地文件化连续性要求的产品和服务的百分比 513 +1. 文件化的服务连续性计划中(关键)产品和服务的百分比 514 +1. 及时更新服务连续性计划 507 507 ))) 508 508 |降低服务的连续性风险|((( 509 - *RTO达成情况(实际灾难和演练)510 - *RPO达成情况(实际灾难和演练)511 - *有效连续性措施的百分比512 - *实际损失与预期损失之比517 +1. RTO达成情况(实际灾难和演练) 518 +1. RPO达成情况(实际灾难和演练) 519 +1. 有效连续性措施的百分比 520 +1. 实际损失与预期损失之比 513 513 ))) 514 514 |确保认知和就绪状态|((( 515 - *按计划进行的演练和认知活动的百分比516 - *在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比523 +1. 按计划进行的演练和认知活动的百分比 524 +1. 在给定时间段内(通常为过去6个月)对其连续性计划进行测试的服务所占的百分比 517 517 ))) 518 518 519 519 表2.8 实践成功因素的指标示例 ... ... @@ -565,7 +565,6 @@ 565 565 * 响应和恢复 566 566 567 567 568 - 569 569 === **3.2.1 服务连续性管理的治理** === 570 570 571 571 该流程包括表3.1中列出的活动,并将输入转换为输出。 ... ... @@ -664,24 +664,24 @@ 664 664 665 665 |关键输入|活动|关键输出 666 666 |((( 667 - *服务文档668 - *风险评估报告669 - *VBF损失的财务数据670 - *重大事件报告671 - *服务模型672 - *风险管理策略673 - *风险偏好674 - *监管要求674 +1. 服务文档 675 +1. 风险评估报告 676 +1. VBF损失的财务数据 677 +1. 重大事件报告 678 +1. 服务模型 679 +1. 风险管理策略 680 +1. 风险偏好 681 +1. 监管要求 675 675 )))|((( 676 - *VBF识别677 - *中断后果分析678 - *VBF相互依赖关系识别679 - *服务连续性要求的确定683 +1. VBF识别 684 +1. 中断后果分析 685 +1. VBF相互依赖关系识别 686 +1. 服务连续性要求的确定 680 680 )))|((( 681 - *VBF的优先级列表682 - *文件化的VBF损失产生的影响683 - *文件化的VBF相互依赖关系684 - *业务影响分析报告688 +1. VBF的优先级列表 689 +1. 文件化的VBF损失产生的影响 690 +1. 文件化的VBF相互依赖关系 691 +1. 业务影响分析报告 685 685 ))) 686 686 687 687 表3.3 业务影响分析流程的输入、活动和输出 ... ... @@ -743,25 +743,25 @@ 743 743 表3.4 业务影响分析流程的活动 744 744 745 745 746 -=== **3.3. 3制定和维护服务连续性计划** ===753 +=== **3.3.2 制定和维护服务连续性计划** === 747 747 748 748 该流程包括表3.5 中列出的活动,并将输入转换为输出。 749 749 750 750 |关键输入|活动|关键输出 751 751 |((( 752 - *业务影响分析报告753 - *现有控件754 - *有关可用资源的信息755 - *消费者的连续性计划756 - *服务连续性策略759 +1. 业务影响分析报告 760 +1. 现有控件 761 +1. 有关可用资源的信息 762 +1. 消费者的连续性计划 763 +1. 服务连续性策略 757 757 )))|((( 758 - *服务连续性策略制定759 - *服务连续性计划制定760 - *服务连续性计划的初始测试765 +1. 服务连续性策略制定 766 +1. 服务连续性计划制定 767 +1. 服务连续性计划的初始测试 761 761 )))|((( 762 - *新的和更新的控件763 - *服务连续性策略764 - *服务连续性计划769 +1. 新的和更新的控件 770 +1. 服务连续性策略 771 +1. 服务连续性计划 765 765 ))) 766 766 767 767 表3.5 制定和维护服务连续性计划流程的输入,活动和输出 ... ... @@ -779,38 +779,38 @@ 779 779 780 780 表3.6 进一步概述了这些活动。 781 781 782 -| (% style="width:147px" %)活动|(% style="width:621px" %)描述783 -| (% style="width:147px" %)服务连续性策略制定|(% style="width:621px" %)(((789 +|活动|描述 790 +|服务连续性策略制定|((( 784 784 基于BIA 报告,服务提供者应该确定一套适当的且具有成本效益的服务连续性策略集。 785 785 786 786 对于影响更早,影响更大的流程和服务,应采取更多的预防措施。对于影响较低且需要较长时间开发的流程和服务,应更加重视恢复措施。 787 787 ))) 788 -| (% style="width:147px" %)服务连续性计划制定|(% style="width:621px" %)(((795 +|服务连续性计划制定|((( 789 789 基于服务连续性政策和策略,服务提供者应该制定和维护服务连续性计划。 790 790 791 791 如果服务或恢复团队成员发生变化,则必须更新计划。计划也可以在演练或实际恢复之后更新。 792 792 ))) 793 -| (% style="width:147px" %)服务连续性计划的初始测试|(% style="width:621px" %)发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。800 +|服务连续性计划的初始测试|发布之前,应测试服务连续性计划。初始测试的方法类似于正在进行的演练。 794 794 795 795 表3.6 制定和维护服务连续性计划流程的活动 796 796 797 797 798 -=== **3.3. 4测试服务连续性计划** ===805 +=== **3.3.3 测试服务连续性计划** === 799 799 800 800 该流程包括表3.7 中列出的活动,并将输入转换为输出。 801 801 802 802 |关键输入|活动|关键输出 803 803 |((( 804 - *认知和演练方案805 - *服务连续性计划811 +1. 认知和演练方案 812 +1. 服务连续性计划 806 806 )))|((( 807 - *进行演练808 - *服务连续性审计814 +1. 进行演练 815 +1. 服务连续性审计 809 809 )))|((( 810 - *演练报告811 - *新的和更新的控件的要求812 - *策略或计划的变更请求813 - *审计报告817 +1. 演练报告 818 +1. 新的和更新的控件的要求 819 +1. 策略或计划的变更请求 820 +1. 审计报告 814 814 ))) 815 815 816 816 表3.7 测试服务连续性计划流程的输入、活动和输出 ... ... @@ -845,21 +845,21 @@ 845 845 表3.8测试服务连续性计划流程的活动 846 846 847 847 848 -=== **3.3. 5响应和恢复** ===855 +=== **3.3.4 响应和恢复** === 849 849 850 850 该流程包括表3.9 中所述的活动,并将输入转换为输出。 851 851 852 852 |关键输入|活动|关键输出 853 853 |((( 854 - *服务连续性计划855 - *事件记录861 +1. 服务连续性计划 862 +1. 事件记录 856 856 )))|((( 857 - *调用858 - *执行服务连续性计划864 +1. 调用 865 +1. 执行服务连续性计划 859 859 )))|((( 860 - *恢复报告861 - *新的和更新的控件的要求862 - *变更计划的请求867 +1. 恢复报告 868 +1. 新的和更新的控件的要求 869 +1. 变更计划的请求 863 863 ))) 864 864 865 865 表3.9 响应和恢复流程的输入、活动和输出 ... ... @@ -928,7 +928,6 @@ 928 928 929 929 角色是在流程和活动的背景中描述的。每个角色都具有基于表4.1中所示模型的一个能力简介的特征。 930 930 931 - 932 932 表4.1 能力代码和简介 933 933 934 934 |能力代码|能力类型(活动和技能) ... ... @@ -938,6 +938,7 @@ 938 938 |M|**方法和技术专家 **设计和实施工作技术,记录程序,咨询流程,工作分析和持续改进 939 939 |T|**技术专家 **提供技术(IT)专业知识并实施基于专业知识的任务 940 940 947 + 941 941 表4.2 中列出了服务连续性管理实践涉及的角色示例,以及相关的能力简介和特定技能。 942 942 943 943 |流程活动|(% colspan="2" %)负责角色|(% colspan="2" %)能力类型|具体技能 ... ... @@ -1087,10 +1087,10 @@ 1087 1087 1088 1088 在恢复过程中,组织结构通常基于连续性计划的级别。表4.3概述了用于响应和恢复的组织结构级别。 1089 1089 1090 -|连续性计划的层次| (% style="width:77px" %)组织层次|(% style="width:602px" %)描述1091 -|战略| (% style="width:77px" %)行政级别|(% style="width:602px" %)这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。1092 -|战术| (% style="width:77px" %)协调级别|(% style="width:602px" %)通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。1093 -|运行| (% style="width:77px" %)专家级|(% style="width:602px" %)一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。1097 +|连续性计划的层次|组织层次|描述 1098 +|战略|行政级别|这包括高级管理/主管人员,他们具有组织内的总体权限和控制,并负责危机管理,联络其他部门,事业部,组织,媒体,监管机构,紧急服务等。 1099 +|战术|协调级别|通常,该级别比主管组低一级,该组负责协调组织内的整体恢复工作。 1100 +|运行|专家级|一系列服务恢复团队,负责在各自区域内执行计划并与员工,客户和第三方保持联系。在IT内部,恢复团队应按服务和产品分组。 1094 1094 1095 1095 表4.3 用于响应和恢复的组织结构 1096 1096 ... ... @@ -1120,14 +1120,14 @@ 1120 1120 1121 1121 尤其是在大型组织中,服务连续性实践应该是自动化的。在可行且有效的地方,可能涉及表5.1中概述的解决方案。 1122 1122 1123 -|(% style="width:89px" %)流程活动|(% colspan="4" style="width:2 93px" %)自动化手段|(% colspan="3" style="width:442px" %)关键功能|(% colspan="3"style="width:132px"%)对实践有效性的影响1130 +|(% style="width:89px" %)流程活动|(% colspan="4" style="width:123px" %)自动化手段|(% colspan="3" style="width:420px" %)关键功能|(% colspan="3" %)对实践有效性的影响 1124 1124 |(% colspan="11" %)服务连续性管理流程的治理 1125 1125 |(% style="width:89px" %)((( 1126 1126 范围的定义 1127 1127 1128 1128 策略设置 1129 -)))|(% colspan="4" style="width:2 93px" %)知识管理工具和文档存储库|(% colspan="3" style="width:442px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3"style="width:132px"%)低1130 -|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:2 93px" %)业务连续性计划工具|(% colspan="3" style="width:442px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3"style="width:132px"%)中1136 +)))|(% colspan="4" style="width:123px" %)知识管理工具和文档存储库|(% colspan="3" style="width:420px" %)服务提供者的员工,监管机构和外部利益相关者(例如客户代表)必须容易访问服务的连续性策略,包括方案的范围,指南,角色和职责。|(% colspan="3" %)低 1137 +|(% style="width:89px" %)认知和演练方案开发|(% colspan="4" style="width:123px" %)业务连续性计划工具|(% colspan="3" style="width:420px" %)服务连续性管理员,服务所有者和恢复团队成员们应有权访问演练时间表,以及他们参与的演练范围的信息。|(% colspan="3" %)中 1131 1131 |(% colspan="11" %)业务影响分析流程 1132 1132 |(% colspan="3" style="width:105px" %)VBF识别|(% colspan="3" style="width:164px" %)服务目录,CMDB,BPM工具|(% colspan="3" style="width:470px" %)为了识别VBF,服务分析人员应有权访问有关服务组件和操作的信息。BPM工具可以提供消费者的流程以及服务支持的操作的有关信息|(% colspan="2" %)高 1133 1133 |(% colspan="3" style="width:105px" %)中断后果分析|(% colspan="3" style="width:164px" %)(((