由 superadmin 于 2025/01/15, 22:26 最后修改
Summary
Details
- Page properties
-
- Content
-
... ... @@ -3,17 +3,17 @@ 3 3 4 4 5 5 6 - 本研究文稿旨在分享中国联通在超大规模信息科技系统运维稳定性保障方面的实践经验,该文稿由中国联通运维负责人在GOPS全球运维大会2022·上海站上提出。本报告深入探讨了中国联通cBSS系统(作为全球最大的电信运营商支撑系统)在运维稳定性保障方面的实践与经验。6 +中国联通在超大规模信息科技系统运维稳定性保障方面的实践经验,由中国联通运维负责人在GOPS全球运维大会2022·上海站上提出。本报告深入探讨了中国联通cBSS系统(作为全球最大的电信运营商支撑系统)在运维稳定性保障方面的实践与经验。 7 7 8 8 9 9 **挑战与困境** 10 10 11 - 报告开篇即指出,随着系统架构的演进,中国联通cBSS系统遭遇了众多挑战与困境。自2014年31省BSS集约化以来,系统经历了2019年的云化、微服务化、分布式架构转型,直至2022年的混合架构实践,期间故障频发、定位缓慢、协作困难、工具分散、数据不贯通,缺乏全流程的可观测性。11 +随着系统架构的演进,中国联通cBSS系统遭遇了众多挑战与困境。自2014年31省BSS集约化以来,系统经历了2019年的云化、微服务化、分布式架构转型,直至2022年的混合架构实践,期间故障频发、定位缓慢、协作困难、工具分散、数据不贯通,缺乏全流程的可观测性。 12 12 13 13 14 14 **稳定性保障体系构建** 15 15 16 -为应对上述挑战, 报告提出了一套全面的稳定性保障体系,该体系涵盖制度规范、运营机制、组织架构及平台工具四个方面的保障措施。该体系依托四大保障,聚焦于研运流程中Ops部分的三个阶段,对应十四项核心工作,目标在于提升中国联通大IT系统的稳定性。16 +为应对上述挑战,提出了一套全面的稳定性保障体系,该体系涵盖制度规范、运营机制、组织架构及平台工具四个方面的保障措施。该体系依托四大保障,聚焦于研运流程中Ops部分的三个阶段,对应十四项核心工作,目标在于提升中国联通大IT系统的稳定性。 17 17 18 18 19 19 **制度规范的保障** ... ... @@ -28,12 +28,12 @@ 28 28 29 29 **平台工具的保障** 30 30 31 -在平台工具保障方面, 报告介绍了中国联通数字化监控平台,该平台为运营保障2.0体系中的十四项核心运营工作提供了端到端、全层级、全流程的工具支撑。这些工具包括配置管理、自动化作业、故障自愈、自动化运维、任务调度平台、变更追踪、业务监控、日志中心、智能监控告警平台等。31 +在平台工具保障方面,介绍了中国联通数字化监控平台,该平台为运营保障2.0体系中的十四项核心运营工作提供了端到端、全层级、全流程的工具支撑。这些工具包括配置管理、自动化作业、故障自愈、自动化运维、任务调度平台、变更追踪、业务监控、日志中心、智能监控告警平台等。 32 32 33 33 34 34 **运营保障篇** 35 35 36 - 报告详细阐述了运营保障的各个方面,包括链路识别、全层级监控、自动化巡检、隐患管理、应急预案、应急演练、故障调度、故障定位和故障闭环。这些措施通过制度规范、注意要点、平台工具和落地方法四个方面进行了详细的阐述,确保了故障的快速发现、定位、处理和复盘。36 +运营保障的各个方面,包括链路识别、全层级监控、自动化巡检、隐患管理、应急预案、应急演练、故障调度、故障定位和故障闭环。这些措施通过制度规范、注意要点、平台工具和落地方法四个方面进行了详细的阐述,确保了故障的快速发现、定位、处理和复盘。 37 37 38 38 39 39 **关键结论** ... ... @@ -57,7 +57,7 @@ 57 57 - 故障闭环:通过故障复盘、故障报告、故障演练、整改跟踪、故障定级、故障定责、故障处罚和故障受教育,确保故障不再发生或可快速恢复。 58 58 59 59 60 - 本报告展示了中国联通在超大规模IT系统运维稳定性保障方面的丰富经验和实践成果。通过构建全面的稳定性保障体系,中国联通成功应对了系统变革带来的挑战,实现了运维的高效管理和数字化转型。这些经验对于其他企业应对类似挑战具有重要的参考价值。60 +通过构建全面的稳定性保障体系,中国联通成功应对了系统变革带来的挑战,实现了运维的高效管理和数字化转型。这些经验对于其他企业应对类似挑战具有重要的参考价值。 61 61 62 62 63 63