大数据及云时代的数据库架构
2018年7月1日
大数据/数据驱动
封神
阿里云高级技术专家、架构师
9年分布式计算、存储、数据库经验,研发集团超过1w台Hadoop集群,万台规模的跨机房建设,并负责其中分布式调度及内存计算引擎Spark。研发集团超过5w台的ODPS集群,自主研发分布式内存引擎,处理超过PB级别数据的迭代计算,并把开源体系融合到内部ODPS体系之中。后从事云产品,构建大数据数据库服务,研究分布式检索与原始数据的融合技术、研究行列混合、存储计算分离、新硬件加速、统一SQL、弹性调度计算、时序、时空、图数据等非结构化等技术,并负责计算与存储产品化,目前为千百客户提供专业存储计算云HBase服务。,
  • 分享简介
    随着物联网、车联网、传感器,很多企业需要面对海量数据、非结构化、复杂分析等问题,我们需要一款适合大数据库的数据库。另外云成为创业公司等默认的选择,云上具有弹性、低成本的优势怎么体现在数据库之中。本次分享主要围绕阿里云数据库团队在开源的HBase基础之上做了哪些增强,怎么支持混合负载的作业,怎么降低成本,及分享计算存储分离为什么可以实现,新硬件一般用在哪里等问题。
  • 分享提纲

    1、数据量增大面临的问题

    2、分布式系统构建的基本出发点,每个主流系统关注的点

    3、云上数据库系统的核心优势

    4、多模式数据库架构

    5、怎么支持高负载的作业

    6、列举几个典型的场景

  • 分享收益

    目标:

    学习更加宏观看待数据世界,学习云数据库设计要点,大数据数据库核心问题点

    成功要点:

    规模化下成本、多模式数据库的分层设计、云资源的弹性使用

    启示:

    如何发挥云数据库的优势,怎么应用到实际的场景之中,比如:物联网、车联网之中

    在哪些场景下,选择什么样的数据库比较适合

    如何弹性的使用云上的弹性资源,在数据库与计算分析层面

热门推荐