云上数据库实践和发展趋势
2017年6月24日
分布式数据库
余锋
阿里云研究员
阿里云研究员,有超过18年的网络和底层系统开发经验,擅长构建大规模集群服务,目前负责阿里云数据库研发和产品体系,在分布式数据库和引擎构建上都有丰富的经验。,
  • 分享简介
    阐述云数据库在大数据时代和软硬件高速发展时期下面临的挑战和发展趋势,以及阿里云数据库在贴近用户的需求下做出的取舍和实践。
  • 分享提纲
    1. https://db-engines.com/en/ranking 为啥那么多数据库 306
    1.1 资源消耗密集性(软硬件变革)
    1.2 场景带动火爆
    1.3 商业公司持续投入 TOP 20
    2. 软硬件变化 操作系统变化 隔离技术变化->
    2.1 网络(RDMA 10us级别),IO(optane 10us级别),超大内存T级别
    2.2 用户空间栈代替内核栈 解决平行扩展瓶颈问题
    2.2 隔离技术 语言虚拟机(Erlang)->CGROUP->DOCKER->KVM->…
    3. 数据库市场和趋势
    3.0 混合云($2B) 去O替代品 ($12B) BI和分析 ($17B) Operation Database   ($36B)
    3.1 大数据带来的AP,搜索,HTAP, 机器学习
    3.2 全球数据库大玩家 每家都有王牌产品
    4. 云数据库发展的特点和关键词
    4.0 产品特征
    4.1 场景化 IOT
    4.2 设计哲学
    4.3 SLA能力承诺
    5. 中间件->
    5.1 SQL网关翻译
    5.2 security, 隔离变化
    5.3 SQL路由负载均衡scalability
    5.4 high availability高可用性
    6 产品形态
    6.1 选择能力
    6.2 MySQL五个产品形态: 1. 单节点(成本) 2. 双节点(业务连续平衡)  3. 三节点(高可用) 4. Petadata(AWS redshift)  5. PolarDB(AWS aurora)
    6.3 HTAP产品/搜索
    6 计算能力扩展->
    6.1 引出产品读写分离,
    6.2 (spanner, tiDB分布式)
    6.3 计算存储分离,Aurora
    7. 存储能力扩展
    7.1 分区/分库分表
    7.2 外部表
    7.3 存储介质层面 更大更快的盘、分布式盘?
    8 引擎多样性
    8.1. 数据结构:B+Tree、LSM tree、Fractal tree(分形树)、Terark ? Succinct data structure简洁数据结构等
    8.2 通用OR专用
    8.3 成本OR性能
  • 分享收益
    1.了解资源消耗密集性

    2.了解全球数据库及大数据带来的AP,搜索,HTAP

    3.掌握产品特征

热门推荐