大规模数据中心的性能分析实践
2019年7月20日
性能和安全
郭健美
阿里云基础软件部高级技术专家
阿里巴巴高级技术专家,花名希伯,目前主要从事数据中心的性能分析和软硬件结合的性能优化。中国计算机学会系统软件专委和软件工程专委的委员。软件工程顶级会议ASE'19 Industry Showcase Track共同主席。
  • 分享简介
    数据中心已成为支撑大规模互联网服务的标准基础设施。随着数据中心的规模越来越大,数据中心里每一次软件(如 JVM)或硬件(如 CPU)的升级改造都会带来高昂的成本。合理的性能分析有助于数据中心的优化升级和成本节约,而错误的分析可能误导决策、甚至造成巨大的成本损耗。本次分享主要介绍大规模数据中心性能监控与分析的挑战与实践。
  • 分享提纲

    - 大规模数据中心性能分析的价值和挑战

    - 性能分析平台构建方案

    - 实际案例分享(复杂软件架构、异构硬件体系、统计分析陷阱等)

    - Q&A

  • 分享收益

    1.目标:

    结合案例,探讨大规模数据中心性能分析的挑战和解决方案,推动数据中心的软硬件优化升级和成本节约


    2.成功(或教训)要点:

    -从业务视角梳理性能分析的价值

    -从软硬件全栈采集和分析性能数据

    -融合领域知识与人工智能构建分析模型


    3.启示:

    -构建面向多种业务场景的统一性能指标

    -形成软硬件一体化的性能分析视图

    -建立分析与验证并行的质量保障体系

热门推荐