8月17日,成章数据CEO陈亮在第十四届中国数据库技术大会DTCC2023上发表了《云原生多模态数据库》的演讲。

数据库百花齐放 但内核创新稀缺

最近几年,随着互联网行业继续向纵深发展,云计算云服务已经成为通用基础设施,越来越多的传统行业也展开了To C业务,数据库行业也从传统的单机主导演变为多种模态齐头并进的发展态势。随着中国创业环境的变化,云厂商在云数据库市场持续发力的同时,中国也涌现出了大量的数据库创业公司,大多数厂商会选择基于成熟的开源软件进行封装,或选择对已有论文进行工程实现,而数据库内核方面的创新因难度较大是鲜少有厂商选择的方向,毕竟数据库内核研发的高级人才在国内依然是很稀缺的。

大浪潮退去 分布式受到质疑

在下一代数据库形态的探索中,近些年兴起的分布式架构成为了大家趋之若鹜的方向。而伴随着各类分布式数据库项目在最终用户的生产场景落地之后,运维复杂、性能不满足以及开发改造成本较高的问题也逐渐浮出水面,当然这其中有很多是产品成熟度的问题,也有许多是架构带来的问题。因此,有一些用户选择了回退到单机或者单机加中间件的架构,那么云原生的分布式数据库是不是一个伪需求呢?成章数据CEO陈亮给出了回应,分布式绝不是伪需求,之所以会有这样的质疑,更多的原因还是许多用户在使用了分布式之后发现无论性能还是易用性、稳定性等方面都跟大家之前熟悉的成熟的商用数据库有一定程度的落差,因此选择放弃了分布式带来的灵活扩展能力,回退到单机或者分库分表的方案中。那么假设,有一款分布式数据库既有分布式提供的多维度的弹性伸缩,同时没有复杂度的提升和性能的下降,那么是否还是有很多用户愿意使用分布式数据库呢,答案是一定的。

真正的云原生弹性伸缩 充分释放分布式能力

大家都知道,单机数据库只能实现资源的垂直扩展,NewSQL数据库虽然能够实现资源的水平扩展,但是必须数据、日志和缓存同步扩展,而成章数据库基于数据基层的能力做到了计算、内存、存储三元解耦,分别伸缩。看上去很简单的一个变化,其实在算法层面是一个非常复杂的难题,成章数据历时三年首次在数据库领域实现了缓存、并发管理、计算、存储和日志的混合扩展。

  • 对小规模流量, 所有模块部署在一台机器,即单机数据库。
  • 对大规模读流量,通过水平扩展缓存模块获得大规模分布式缓存,即纯内存数据库。
  • 对大规模写流量,通过水平扩展日志模块获得分布式并行日志,提供低延时、高吞吐写入性能。
  • 对大数据,通过水平扩展存储模块来增加存储容量。

这种混合扩展的模式为用户带来了云上真正的弹性和灵活伸缩能力,使得不同场景的应用能够有与之最为匹配的数据库能力以及最合理的成本。

不牺牲性能的分布式 才是好的分布式

数据基层的核心能力主要基于以下方式实现:

  • 分布式内存表负责缓存和并发管理 (CC map)——Map: Key à <Payload, Lock>
  • 分布式日志负责数据持久化
    1. 数据修改关键路径: (1)内存表加锁, (2)同步写入日志, (3)内存中释放锁及更新数据
    2. 基于逻辑时钟的并行提交协议
  • 缓存替换算法将冷热数据在缓存和存储间置换——更新的缓存数据在踢出前写入数据存储
  • 分布式容错协议利用分布式日志实现内存节点的 failover——未写入存储的缓存数据从日志恢复到缓存

成章数据已经基于数据基层的能力打造出可以混合扩展的分布式关系型OLTP数据库、缓存数据库、未来还将继续发布具备混合扩展能力的文档数据库等等适用于多种流量场景的真正云原生数据库矩阵。

已发布产品支持用户免费测试,感兴趣的用户可以在“成章数据”公众号后台留言申请免费试用!

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐