信息技术运维数据治理与人工智能运维支持系统(AIOPS)的交互式支撑能力架构
IT运维数据治理与AIOps交互支撑能力框架,通过数据治理与智能运维的融合,提高IT运维的效率与成效。由ITIL先锋论坛解决方案副总裁在GOPS全球运维大会2022·上海站上提出,该论坛是国内领先的数字化时代IT服务管理交流社区。
效率与成本的冲突
智能运维已步入“深水区”,在效率提升的同时,面临数据治理的挑战。例如,黄金指标检测与告警收敛虽已成熟应用,但在全领域指标应用异常检测与提升隐患感知方面,受限于运维数据的整体质量与完整性。此外,信息系统常规趋势性发展带来的资源增长,虽已应用智能趋势预测,但在建设综合的业务与应用关联预测时,因数据关联不完整而难以有效规划。
交互式建设方案
交互式建设方案,强调运维场景与数据治理建设的相互支撑。通过融合数据治理与智能数据治理,实现全面智能自动降噪、资产发现、特征识别与动态关联。运维场景建设包括主机检测、网络诊断、应用瓶颈与容量预测等,而数据治理建设则涵盖数据资产、标准治理、数据模型与数据审计等方面。
新一代数据底座:数智平台建设方案
新一代运维数据底座——数智平台的建设方案。数智平台具备数据管理、自我观测、数据标准化与数据模型等关键特性。它通过开箱即用的数据获取、应用成效反馈优化与智能数据底座,实现完整性覆盖、服务化应用与场景化组织。数智平台的运维管理模型基于原子运维数据模型,融入运维标准问题解决的最佳实践,将关键运行逻辑、知识、规则转化为数据的组织结构。
共生式的智能运维建设
智能运维与数据底座的共生式建设。通过引入运维管理模型,一方面为更多运维场景提供开箱即用的有效数据支撑,另一方面通过智能运维场景的成功应用数据经验,沉淀入运维数据治理,实现智能运维与数据底座的共生发展。
展望
展望AI提升数据治理效率的未来,强调场景能力与数据能力的融合发展。智能运维平台将整合运维场景应用、异常检测、告警收敛、根因分析与资源规划等功能,而数据治理场景则涵盖维度降噪、元素发现、特征识别与关联发现等方面。通过智能数据底座,实现运维大数据、CMDB、日志、APM、NPM、基础监控与业务监控等数据的整合与应用。
IT运维数据治理与AIOPS的交互支撑能力框架,强调通过数据治理与智能运维的结合,提升IT运维的效率与成效。通过新一代数据底座——数智平台的建设,实现运维场景与数据治理的相互支撑与共生发展,为未来的IT运维管理提供了新的思路与方法。