刘亚运 小米大数据、AI平台、容器云SRE负责人,主导大数据运维平台体系从0构建,同时也参与小米自动化智能化运维体系构建,经历了小米高速增长的6年,在保障服务可用性和自动化运维方面经验丰富。

刘亚运
小米大数据、AI平台、容器云SRE负责人
-
分享简介互联网高速发展的今天,海量大数据集群自动化智能化管理和监控是一个挑战, 全自动化的集群运维体系构建,可以为企业在人力和成本上做出很大的节约。一个创业公司大数据集群规模从0到数万台规模短短的几年时间,我们在管理和监控上面临着很大的挑战。迎接挑战,从机器管理到集群,部署到监控,自动化到智能化等各方面展开,分享大数据运维体系平台构建的一些经验。
-
分享提纲
一1.1 平台架构演变
1.2 大数据技术框架
1.3 大数据运维存在的问题
二 小米大数据运维平台体系构建
2.1 运维规范
2.2 部署系统体系设计
2.3 统一监控和统一告警
2.4 集群安全账号系统设计
2.5 资源可视化,成本化
2.6 安全审计
三 大数据思维做运维监控
3.1 设计与实现
3.2 大数据思维
四 智能化大数据运维探索与思考
4.1 探索
4.2 思考
-
分享收益
分享收益:
目标:从自动化走向智能化等方面的设计实现,对即将做、正在做、已经做的大数据运维相关企业都有受益
成功点:大数据运维体系构建给予启迪和指导,如何做安全,如何做管理,如何做监控,如何控制成本。
收益:从机器管理到集群,部署到监控,自动化到智能化等各方面展开,了解大数据运维体系平台构建的一些经验。
热门推荐
-
提升领导力:OKR目标管理和激励查看主题
-
京东宙斯618大促开放平台技术架构实践查看主题
-
知识中台:基于知识图谱如何快速构建垂直领域的智能客服查看主题
-
低资源下实时语音图像翻译技术查看主题
-
算法变现经验谈查看主题
-
高性能JVM:从原理到实践深度解析查看主题
-
云原生应用的微服务与Serverless实践查看主题
-
构建企业DevOps度量体系-DevOps驱动价值的交付查看主题
-
《极致产品规划及高效用户需求洞察》--工作坊查看主题
-
项目管理的研发治理查看主题
-
云原生消息系统Apache Pulsar简介查看主题
-
自适应安全技术实践查看主题
-
超大型运维平台的面向终态设计查看主题