在现在越来越强调云本地的环境下,存储计算的分离已经成为大势所趋。大乎所有我们熟悉的云数据库都开始使用存算分离来实现资源价值的最大化,如阿里的PolarDB、AWS的Aurora、华为GaussDBDBMySQL等。大量企业建设数据中心也开始采用开源数据库和库存分离的方式进行配置。
那么,让我们来看看这些先进的互联网公司和数字转型企业,如何在数据库改造中一步分离存款?
分布式数据库是时代的选择<
从1970年IBM开始的E.FCodd是论文《ARalationalModel开始Datafor,LargedDatanks》中提出的数据库系统关系模型,开始了数据库关系方法和关系数据理论的研究,为数据库技术奠定了理论基础,直到1977年发表Oracle数据库,IBM开始了IBM和Orcle等大型数据库市场的20年度数据库。
到90年代中期,随着互联网时代的到来,开源数据库MySQL、PostgreSQL的出现,这种垄断现象被打破,以MySQL为代表的开源数据库开始迅速发展。
21世纪10年代,数据井喷式增长,对数据库提出了水平扩展、大集群规模、高并发等新诉求,随着公共云的蓬勃发展,以云为载体兼具高可扩展性、高并发性、高可用性的分布式数据库,如谷歌Spanner、Snowflake、AWS、AWS、Aurora等
至此我们可以看到分布式数据库的诞生是顺应时代的发展,是时代的选择。
分布式数据库改造,库存计算一体化部署框架
分布式数据库最成功的应用场景支持初期电气商务的快速发展,但随着企业数字转型的深入,数据总量和形式呈指数级的增加,数据库应对高性能、高可靠性的挑战原有的分布式数据库存一体化,服务器本地盘的配置方式越来越无力。
例如,由于计算、存储资源的束缚,在应对双11等突发资源的高峰时,只能迅速扩大计算资源,分布式改造后不能支持多带带的弹性扩展,违背分布式改造的初衷。同时亚马逊、阿里等厂家在自身和云客户的使用中也发现以服务器本地盘的方式部署,在存储可靠性、爆炸半径、综合成本等方面存在难以解决的问题。
以某运营商为例,在基于MySQL开源软件自研的数据库使用服务器本地盘部署的模式下,计算资源(CPU和内存)与存储资源(SSD磁盘)存在不可调和的冲突(使用不均衡、扩展受到限制、管理困难等)
这样的问题在互联网、金融、职业云变革企业中特别突出:
-可靠性低:服务器可靠性低,问题数据无法访问或丢失,必须从多个同步中填补可靠性差距,服务器网络摇晃和磁盘亚健康问题难以监视处理
-运输困难:更换设备或扩张需要转移数据库,全量同步数据缓慢,以前数据库数量小,现在单库分成数量10个例子,未来全网整改后,数千个例子,运输复杂,原本只有2台小型机器,现在20台以上
-成本高:存算绑定,无法弹性扩容,资源闲置,CPU利用率低,为保证可靠性增加副本数,现有架构成本是原来的1.5倍。
如何解决分布式数据库结构中服务器当地盘部署的一系列问题?行业不断探索,2014年AWS首次推出Aurora,蚂蚁于2017年推出PolarDB,华为云于2020年推出GaussDBForMySQL,华为存储也于2021年为企业建立自己的数据中心
行业云本地实践:存算分离,共享存储是分布式数据库的最佳选择
没有概念和结构,存算分离也是行业根据当前分布式改造的现状和当地盘配置的弊端不断探索的
存算分离带来的四大价值:
-可靠性提升:外置共享存储可靠性结合云原生故障隔离和迁移能力,解决一体化方案可靠性短板,并为降低资源冗余提供基础;
-资源优化:解决数据快速移动,实现计算、存储弹性扩展,按需分配,减少因可靠性、运维能力不足造成的硬件冗余;
-能力复用:使用共享存储成熟的备份恢复、SSD介质延寿、亚健康等能力,快速提升数据库整体解决方案能力,节约开发成本;
-架构先进:基于开放生态存储底座,可快速实现云原生数据库能力,不影响上层应用,实现平滑演进。
各行各业在数字转型中面临业务量爆炸性增长、业务互联网化等挑战。为了在新的形势下提高服务体验,国内某运营商联合华开展创新和应用实践,采用分布式数据库存计算分离方案构建高效BSS系统,实现计算、存储资源在线弹性扩展,整体资源利用率从10%提高到50%数据重建全自动化,恢复时间从3小时缩短到5分钟
总结
随着5G、分布式技术、云计算技术的发展和各开发者_JS百科行业数字转型的深入,数据库云、数据库云的原始结构成为趋势,计算、存储分离、共享存储方式是数字转型企业的共同选择。
精彩评论