
陈小龙
今日头条数据资深研发工程师
陈小龙,今日头条数据资深研发工程师,曾出版图书《微信公众平台开发实战与应用案例》,《php7实践指南》,目前主要研究数据领域,
-
分享简介分享内容是业内广告系统中常用的离线计算和实时计算技术,介绍大数据在广告系统中的具体应用以及各个大数据工具组建之间的协调同步应用实践。讲解广告系统中所涉及到的hadoop,spark,hive,elasticsearch,druid等常见技术的应用规模和应用场景,如spark在系统计费环节,数据流处理环节的具体实践,hive在数据仓库中的数据分层建模,以及如何将应用维度数据导入在线查询引擎es druid,如何选定合理的数据聚合方式。然后还讲解到es druid的存储原理,行式存储和列式存储的区别。分享内容从基础使用到原理讲解,从系统架构到技术细节,从宏观概括到原理认识。
-
分享提纲
基于大数据使用平台计算技术展现如下实例
Hadoop
Spark
Hive
ElasticSearch
Druid
-
分享收益
1.目标:构建一套广告系统中的大数据服务平台
2.成功(或教训)要点:优化离线计算的数据产出流程,减少计算时间,优化用户体验,增强实时计算的服务稳定性可扩展性,防止维度爆炸数据激增带来的安全隐患
3.启示:可以对业内广告系统中的大数据应用有个整体认识
热门推荐
-
提升领导力:OKR目标管理和激励查看主题
-
京东宙斯618大促开放平台技术架构实践查看主题
-
知识中台:基于知识图谱如何快速构建垂直领域的智能客服查看主题
-
低资源下实时语音图像翻译技术查看主题
-
算法变现经验谈查看主题
-
高性能JVM:从原理到实践深度解析查看主题
-
云原生应用的微服务与Serverless实践查看主题
-
构建企业DevOps度量体系-DevOps驱动价值的交付查看主题
-
《极致产品规划及高效用户需求洞察》--工作坊查看主题
-
项目管理的研发治理查看主题
-
云原生消息系统Apache Pulsar简介查看主题
-
自适应安全技术实践查看主题
-
超大型运维平台的面向终态设计查看主题