某金融公司基础设施IT运维管理体系的实践之旅
华泰证券在GOPS全球运维大会2022·上海站的演讲内容,主题聚焦于“华泰证券云网基础设施营运体系的探索与实践”。阐述了华泰证券在云网基础设施运维管理领域的实践与经验积累,旨在提升基础设施的运营效率与服务质量。
云网基础设施现状分析
华泰证券的科技发展历程可划分为三个阶段:
- 2009年至2014年:抓住移动互联网的发展机遇,率先启动互联网战略,推出涨乐财富通,零售业务跃居行业首位。
- 2017年至2020年:实施平台化战略创新,首个全自研产品MATIC上线,机构服务平台行知正式推出。
- 2019年至2022年:全面实施数字化转型,发布数字化转型白皮书,制定数字化转型发展规划。
华泰证券构建了“一网四云”的基础设施体系,涵盖核心业务云、开发测试云、协同工作云和金融行业云,以满足不同业务领域的需求。采用混合云部署模式,服务对象包括对外服务和对内支撑,承载的业务类型包括核心业务、新技术验证、协同办公和金融生态等。
基础设施营运体系实践探讨
面对云网资源快速增长、管理平台众多、成本控制及效能提升等问题,华泰证券提出营运体系建设思路,以DevOps技术运营为核心,以FinOps为指导原则,实现基础设施的“降本、增效、提质”三大核心目标。
营运体系建设路径
- 线上化/流程化:通过线上化手段管理基础设施资源,构建虚拟机、负载均衡、服务器等流程70余个。
- 自动化/自服务:利用自动化技术提高资源管理效率,支持虚拟机开关机、重启、上网行为策略等自服务场景10余个。
- 数据化:通过数据化手段展示基础设施资源运维、使用、运营情况,构建基础设施相关报表40余个。
- 智能化:依托数据支持,借助AIOPS能力,逐步构建基础设施运维智能化能力。
统一融合的云网营运体系架构
华泰证券构建了统一融合的云网营运体系架构,包括基础设施服务台、桌面云门户、基础设施运营台等,实现资源服务、成本管理、效能管理、质量管理等功能。
管控分离的运维体系
华泰证券采纳了管控分离的运维体系,管理侧负责一网四云的管理,控制侧负责具体云平台的控制。通过流程与实施相分离,外购底层能力,构建自有个性化场景,实现运维防腐层建设。
成本管理成效
华泰证券在成本管理方面取得显著成效,具体包括:
- 成本合理性能力:达到DevOps技术运营成熟度3级标准,处于行业领先水平。
- 成本分摊算法:针对各类资源,构建成本分摊算法,实现资源全生命周期管理。
- 成本账单:部门内定期发送资源使用成本账单,增强成本意识。
效能管理成果
华泰证券对资源使用的前、中、后进行全方位管理,强化用户效能意识,提升资源使用效能。通过效能计算、效能通报、资源优化等措施,节约资源17%。
质量管理措施
华泰证券通过黄金指标监测、异常检测、故障演练等措施,确保基础设施的高质量运行。监测指标包括主机通信值、CPU利用率、内存利用率等,通过演练提升系统的健壮性和可靠性。
案例分析展示
报告还提供了多个案例分析,展示了华泰证券在基础设施运维管理方面的具体实践和成果。例如,通过成本管理、效能管理、质量管理等措施,实现了资源的优化配置和高效利用。
后续发展计划展望
华泰证券的后续发展计划是迈向智能化运维,涵盖部分自动化、大规模自动化、数据化和系统辅助作业等阶段。目标是实现大部分运维工作自动化执行,系统集中感知和分析,最终实现智能化决策。
华泰证券通过构建“一网四云”的基础设施体系,实现了资源的高效管理和优化配置。通过线上化、自动化、数据化和智能化的运维体系建设,提升了基础设施的运营效率和质量。未来,华泰证券将继续推进智能化运维,实现运维工作的自动化和智能化。