2024年主机上云运维现代化核心能力白皮书.pdf

2024年主机上云运维现代化核心能力白皮书.pdf
本文档由华为发布,旨在探讨金融行业主机上云背景下,运维面临的新挑战与华为云的解决方案。 **1. 主机上云带来的运维新挑战:** * **高可用与高可靠:** 基于应用视角设计高可用上云方案与高可靠运维保障方案。 * **全链路监控:** 云平台技术栈快速增厚,如何有效进行全链路可视监控。 * **云网深度融合:** 云网深度融合,快速发现、定位、恢复问题。 * **双重安全:** 如何应对运维安全与租户安全的双重挑战。 **2. 主机上云运维现代化核心能力:** * **平台运维现代化:** * 全链路运维监控:构建从应用到云平台的全栈感知能力。 * 确定性故障恢复:基于故障模式库和云网一体化运维,实现确定性故障恢复。 * 预见性风险治理:基于一体化风险库和混沌工程,进行预见性风险治理。 * **应用运维现代化:** * 运维规划前置:业务可靠性来源于运维与设计的融合。 * 借助运维数仓:构建应用可用性监控管理体系,实现业务故障实时感知定界。 * 面向故障全生命周期:全方位提升故障感知、诊断、恢复智能化水平。 * **安全运维现代化:** * 全视角运维安全:构筑金融云运维安全堤坝。 * 体系化、智能化安全运营:云上业务保驾护航。 **3. 核心技术与方法:** * **全链路监控:** 从应用层、PaaS实例层到IaaS层构建全栈监控,实现快速感知故障。 * **应用可观测性:** 借助APM,实现调用链和指标监控。 * **基础设施可观测性:** 通过云平台提供的SLI指标进行监控。 * **确定性故障恢复:** 故障模式库、云网一体化运维,实现快速定位和恢复。 * **FMEA故障模式分析:** 识别潜在失效模式,构建故障模式库。 * **故障模式库运行机制:** 一键式诊断和恢复。 * **预见性风险治理:** 建立运行态风险主动预防体系。 * **云网一体化运维:** 应用与网络的统一监控和管理。 * **eBPF应用端点无损监测和iFIT真实业务流链路监测:** 实现业务流的深度监控。 * **CloudNetDebug虚拟网络拨测:** 虚拟网络诊断。 * **Fabric Insight物理网络定界:** 物理网络故障分析。 * **混沌工程:** 通过主动注入故障,提升系统韧性。 * **应用运维现代化:** 业务高可用设计。 * 业务容灾等级评估和策略。 * 高可用治理。 * **借助运维数仓:** 实现业务故障实时感知定界。 * **业务指标体系搭建:** 可观测性指标设计。 * **运维数仓:** 数据集成、ETL、数据湖、MPPDB、数据应用等。 * **安全运维现代化:** 全视角运维安全体系,保障云上业务。 * 事前、事中、事后全流程安全保障。 * 建立中心化风险库和风险评估机制。 * 实施权限管控、审计、安全策略。 * 构建立体防御体系,智能安全。 **4. 安全运营理念:** * 从被动安全向智能安全转变。 * 从重建设轻运营向三分建设、七分运营转变。 * 构建云原生安全技术体系。 **5. 价值:** * 提升故障主动发现率,减少业务影响。 * 通过数据分析,快速定位和解决问题。 * 主动预防风险,构建高可用、高可靠的云上业务。
在线阅读 下载完整报告 | 2.4 MB | 46页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告