从跟随者到开拓者,阿里云数据库角色变化背后的机遇与挑战

数据库经过40多年的发展与变迁已经改写了格局,在开源、云端浪潮之下曾经的数据库霸主Oracle也已经跌下王座,不断向着云与智能化发展,新的厂商也获得了各自机会,在云数据库时代是一个百花齐放、百家争鸣的状态。

由于业务飞速发展,亚马逊和阿里两位电商巨头在10年前开始了自己的去“O”(Oracle数据库)运动,一直以来阿里云在数据库方面被认为是AWS跟随者,如今已经基本做到与AWS持平,甚至在某些方面已经领先。

根据Gartner统计,阿里云已经位居全球云数据库市场份额前三,年增速在115%。同期AWS增速为74%,Oracle为66%。而POLARDB在2018年正式商业化后,目前已经是阿里云上增长最快的数据库产品。

去“O”运动中的数据库市场变迁

2013年阿里巴巴最后一个Oracle数据库从从其淘宝核心系统中下线,10月15日亚马逊宣布其消费者业务也关闭最后一个Oracle数据库。

上个世纪70年代以关系型数据库起家的Oracle一直以来都是商用数据库的王者,与IBM DB2以及微软的SQL Sever基本垄断了传统商业库市场,曾经阿里是Oracle数据库在中国市场的头部客户,但是随着业务的发展,Oracle在性能上已经无法满足,而且成本高昂。

2009年前后阿里巴巴的总体流量一直高速上涨,但王坚博士认为如果再以当时的架构持续下去,为了能够支持流量的承载,阿里巴巴购买服务器、数据库产品的支出就足够让阿里巴巴破产,所以阿里巴巴开始了整个IT架构的升级,在对上层进行了微服务化后开始去“IOE”之路,其中的“O”就是Oracle数据库。

数据库是最难迁移的技术之一,因为通常企业中的多个软件应用在数据库上运行,一旦更换新的数据库所有应用程序都要被重写或替换,往往数据库项目迁移需要数年时间,亚马逊和阿里数据库迁移便是很好的例证。

2008年之后阿里基于开源数据库MySQL做AliSQL对内核进行改造调优,2011年随着阿里云的发展,开始进一步基于AliSQL搭建RDS平台,既对内服务又对外输出。在2013年淘宝下线最后一个数据库,之后阿里云数据库更多的是对外商用,不仅将阿里云数据库的技术,还有实践经验对外输出,与此同时阿里云数据库也逐步构建起MySQL、AliSQL、PostgreSQL、MariaDB开放数据库生态,2017年阿里云数据库用户实例突破了10万大关。

阿里和亚马逊的去“O”之路是数据库市场变迁的一个缩影,从以Oracle、DB2、SQL Sever为主的传统商业数据库,到以MySQL、PostgreSQL、MongoDB、MariaDB、Hbase为代表的开源数据库,据悉阿里巴巴在2013年左右开始大规模使用开源数据库,这与DB-Engines的数据库流行度趋势非常吻合,从DB-Engines数据库流行度来看,开源数据库从2013年开始到现在一直增长,直追商业数据库。

而在云端浪潮之下,数据量的激增,使得传统数据库和开源数据库在性能和成本等方面已经无法满足,云原生数据库正在引领数据库市场的新潮流。

阿里云数据库事业部总经理曹伟在今年云栖大会上指出云原生数据库未来发展趋势:

弹性:弹性不仅仅是规格的弹性,而是未来CPU、容量等计算资源都可以按量付费。

HTAP:之前TP和AP是分开处理的,TP使用关系型数据库,而AP使用大数据存储。未来则会融合两者,提供一个入口跑事务,一个入口跑报表和BI。

智能:智能让数据库更加实用,未来数据库的磁盘备份、内存调度等都不需要DBA来操作,而是全部由数据库自己来完成。此外,数据库还能够自动完成诊断和修复。

混合云:因为一些合规的要求,并不是所有数据都能跑在云上,因此还需要使用云上云下互联的生态。

云原生数据库的发展来自于云计算厂商的数据库自研之路,AWS和阿里云是其中的代表,“我们背靠阿里巴巴集团,身处复杂的生态环境,从电商到线下的新零售,像盒马以及线上娱乐如优酷等等,不仅对我们的技术提出了非常大的挑战,也提供了极为丰富的练兵场。这是我们能够持续走下去并不断衍生出新技术的一个核心保障。”阿里云智能数据库事业部负责人李飞飞在接受ITPUB采访时指出。

而在云原生时代阿里云也完成了从跟随者到开作者的转变。

从跟随者到开拓者

从传统商业数据库到开源数据库,再到自研数据库。自研之路往往艰难,而这条艰难之路更代表未来。

2014年AWS发布了关系型数据库Aurora,2015年阿里开始自研新一代云原生数据库POLARDB,选择了和Aurora同样的思路,采用存储计算分离、软硬一体化设计。

2017年阿里云公测自研关系型数据库POLARDB,被阿里称为新一代数据库的POLARDB当时在业在内并没有引起太大的轰动,它被认为是AWS Aurora的跟随者。在云端,不仅是数据库模块,从IaaS到PaaS,AWS都是是绝对的领先者,但是中国的数据库产品跻身世界一流数据库品牌正是从阿里云推出POLARDB开始的。

李飞飞在接受ITPUB采访时曾坦言阿里云跟随者的身份:“我觉得我们一开始是一个Follower(跟随者),这个没什么不好意思承认的。但是我们要从Follower做到超越者,做到leader。”

经过十多年的发展阿里云已拥有非常丰富的云数据库产品家族,涵盖关系型数据库、非关系型数据库、分析型数据库以及迁移工具等,满足用户不同的数据库应用开发需求,并且解决企业核心业务上云的关键难题。

李飞飞认为阿里云已经从Follower做到基本与AWS持平,甚至在技术上某些领域做到了领先。比如OLAP , AnalyticDB的性能已经在TPC-DS上打榜,并排到了第一。通过和AWS官方Redshift对比(在AWS上去买Redshift跑同样的Workload),在TPC-DS的很多Query,AnalyticDB的性能都要优于Redshift。另外,在某些领域,阿里云已经做到了人无我有,比如,在分布式数据库板块,因为阿里集团的“双11”场景需求,需要做share-nothing的架构。因此在PolarDB基础上做了PolarDB分布式版本。以Share-nothing的分布式架构来支持“双11”海量高并发数据的应用场景支撑,AWS并没有和阿里云对标的产品。

很多业内人士指出实际上阿里云数据库的整体能力并不仅仅表现在相对完善产品堆栈,这一点AWS也比较完善,更多的是对中国市场和客户需求的理解以及这些年来积累的实践经验。李飞飞曾经谈到过中美客户的差异,比如很多大中型国有企业,美国没有这种组织架构,其需求和美国的商业公司肯定有不同。“这会对我们的技术演进之路提出一些新的思考、新的挑战,也就会使我们最终会走出一条不同于Aurora的技术之路。”

但是在云端浪潮下,更为激烈的变革序幕已经开启,“传统数据库会像马车一样被淘汰。”李飞飞表示。Gartner的调研报告指出云数据库正在快速增长,到2022年预计有3/4的数据库天然部署或者迁移到云上。

而在中国市场也到了传统产业变革的下半场,只是这个更为庞大的市场上云并没有那么快,尤其在核心的数据库方面,有的行业甚至无法上云,一位在数据库领域从业超过20年的老兵质疑过“云计算厂商开发的数据库系统,市场目标是在自家的云上提供服务,而不是作为传统软件卖许可证。因此,很多打算摆脱Oracle,采用国产数据库,但又还没打算上云的用户,就很难享受到这类产品。”

在云端曾经的数据库王者Oracle也不再拥有优势,这也给阿里云等挑战者一个超越的机会。

面对这样的困局,这一次阿里云走在了前面。在2019年云栖大会上阿里云首推云原生数据库一体机POLARDB BOX,它能够更好地帮助用户在私有云上使用POLARDB数据库,实现“把云带回家。”在云端转型更加深入的当下阿里云进行了有益的探索,“把云带回家”也让POLARDB从跟随者变成开拓者。

目前阿里云数据库已服务政务、零售、金融、电信、制造、物流等领域的龙头企业,已有约40万个数据库实例迁移到阿里云上。

阿里巴巴的价值观中有这样一条:“唯一不变的是变化”,在这个飞速变革的时代,技术的演进与更迭速度正在成倍增长,十多年的数据库实践让阿里云积累了技术经验和相关方法论,不过传统产业的需求更加复杂多样,其中也不乏华为、AWS等同台竞技的玩家,战争的号角也只是刚刚吹响,还需要阿里们深入到产业中去探索与磨合。


10月25日,阿里云数据库技术沙龙北京站即将举行,本次沙龙特别邀请阿里云数据库专家团队分享阿里云数据库在阿里巴巴集团业务的广泛应用以及阿里云数据库背后的黑科技,资深阿里云数据库专家也将对现场收集的问题和痛点进行解答。欢迎扫码报名观看直播。

Image placeholder
gray_lin
未设置
  17人点赞

没有讨论,发表一下自己的看法吧

推荐文章
云计算下半场,从金融业变革看云原生的机遇与挑战

在数字化转型过程中,上云上平台是非常关键的一步。如今是否上云已经不需讨论,云计算在国内经过十年的发展走到了下半场,成为传统产业升级的新助力。而伴随着容器、微服务等技术的逐步成熟,云计算也走到了云原生时

阿里云数据库成功背后 所谓开挂不过是厚积薄发

摘要:国内数据库领域,从未像今年这般热闹非凡,不仅进入该领域的企业越来越多,呈现出现了井喷式的发展和百花齐放的盛局,并且取得的重大突破是一个接着一个,这在过去,几乎是不可想象的事。数据库的重要性不言而

人工智能给陌陌直播带来的变革与挑战

中国的人工智能产业相较国外起步较晚,但崛起迅速,尤其是人工智能上升为国家战略以来,更是吸引科技巨头以及众多垂直领域公司深耕不辍。在内容直播领域更是掀起一股强劲的浪潮,毫不夸张地说,AI技术已经成为了内

阿里云小蜜对话机器人背后的核心算法

0.对话系统简介 对话系统的一般架构如图: 图1:对话系统一般架构 这是我们所熟知的对话系统框架,这里面主要有:NLU自然语言理解,DM对话管理,NLG自然语言生成3个主要模块,DM里面有dialo

中信银行信用卡业务数据库实现国产替换,湖北银行新核心系统项目正式验收,阿里云与MongoDB达成战略合作

中信银行信用卡业务数据库实现国产替换10月31日,由IT168旗下ChinaUnix社区主办的第十一届中国系统架构师大会(SACC2019)在北京召开。会上,中信银行软件开发中心/技术平台开发处副处长

传统灾备的痛大家都懂,阿里云定义企业级云灾备

灾备,并不是一个新鲜词,它起源于70年代。灾备,顾名思义,即容灾+备份。容灾,通常是在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,目的是为了在遭遇灾害时,能保证业务连续性。而备份是

拐点已至,阿里云进入All in Cloud全面上云时代!

当新旧设备交替势不可挡,当云的基础设施开始超过传统的数据中心,一个新时代开始了。在这样的时代里,以数据、计算、智能为主要特征的新一代信息技术,开始成为企业数字化转型的核心动力。对于所有云服务商来说,就

软件定义一切,企业数字化背景下的新一代IT基础架构

 在数字经济飞速发展的背景下,企业数字化转型已经成为目标共识,企业需要建立更敏捷、智能、安全和可控的数字化转型平台,而云为这一切提供了便利条件。  软件定义作为云的一项重要技术,这几年的也变得越发火热

搞个大事情,阿里如何实现上亿级数据的精准计数?

背景关系型数据库在执行计数任务时,其执行效率会随着数据量级的增长而降低;当数据量达到亿级别时,计数任务的执行效率已经低到令人不忍直视。在闲鱼团队的关系系统中,我们采用了这样一种方式来实现亿级别数据的毫

AI 计算竞争升级,参访平安科技背后的硬实力

平安科技的四块科技版图,分别是云、认知、区块链和人工智能。所有的AI公司在AI领域中最核心的壁垒不是技术,因为技术都是人创造的,打磨团队就可以。核心的壁垒应该时间、业务和场景。智能科技的涌现、大数据

腾讯财报背后的小秘密:转型路上的未知

8月14日,腾讯发布第二季度财报,不凑巧的是,当日欧市盘中,美国2年期与10年期国债利率发生2007年来首次倒挂,引起市场对经济衰退的恐慌,美股三大指数均暴跌3%。8月15日,中国香港恒生指数低开1.

“小应用”背后的“大改变” 爱奇艺赋能流媒体播放服务

热门视频里,“弹幕盖脸”几乎是必然事件,然而有一个地方看视频,你会发现密密麻麻的弹幕都绕开主角飘过,这个地方就是爱奇艺。对于大家观看视频时喜闻乐见的弹幕,爱奇艺提供了蒙版弹幕服务,可以让用户实现“弹幕

云徙助力良品铺子「双11」:成为5.6亿背后的技术力量

每逢双十一时节,品牌的种草之心被推到顶峰。在密集的信息交汇中,消费者希望获取有价值的消费决策,品牌则希望被广泛看见、被坚定选择,此时,格外凸显出中台+精准营销的重要意义。双11购物狂欢节”已走过11个

从MySQL到POLARDB, 三位CTO讲述迁移背后的故事!

摘要: 去年9月21日,阿里云发布了自主研发的通用云数据库POLARDB公测版,今年4月,POLARDB正式商业化。此前,POLARDB核心卖点是100%向下兼容MySQL5.6,100TB存储容量,

信泰人寿“去IOE”背后的故事

十年前,以IBM小型机、Oracle数据库和EMC存储设备为代表的IT基础体系,被广泛应用在全球各大企业当中,并长时间垄断了国内商业数据库领域,紧攥着中国信息安全的命脉。彼时,“IOE”三大巨头,稳坐

超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器资源的按需分配问题?

导读:资源利用率一直是很多平台管理和研发人员关心的话题。本文作者通过阿里巴巴容器平台团队在这一领域的工作实践,整理出了一套资源利用提升的方案,希望能够带给大家带来一些讨论和思考。引言不知道大家有没有过

大咖齐聚DTCC2019,共论云数据库前景

2019年5月8日,由IT168旗下ITPUB企业社区平台主办的第十届数据库技术大会(DTCC2019),在北京新云南皇冠酒店正式开场。本届大会以“数据风云十年变迁”为主题,百余位行业专家就热点技术话

对话蒋杰、丁奇,腾讯云数据库之路

此前,笔者曾经就腾讯云数据库战略升级一事写过一篇文章,对腾讯云数据库聚焦“云原生”“自治”“超融合”三大方向背后原因,以及怎样理解腾讯云数据库战略升级与五大新品、三大方向的关系进行了分析。近日,在腾讯

独家对话李飞飞:云数据库战争已经进入下半场

李飞飞,现任阿里巴巴集团副总裁、高级研究员,阿里云智能数据库事业部总负责人。加入阿里巴巴之前为美国犹他大学计算机系终身教授。研究成果多次获得了IEEEICDE、ACMSIGMOD最佳论文奖等重要学术奖

云数据库反脆弱性运维体系

摘要:本文主要分享如何构建反脆弱性的云数据库服务体系与实践,实现分布式云数据库服务的高可用方案,同时采取措施保护分布式云数据库整体服务,实现跨机房分布式自动切换方案,并在实践过程中,实施分享SQL自动

DTCC | 云数据库时代已来,你准备好了吗?

作为基础软件之一,数据库一直是企业IT系统的核心,过去数十年,数据库技术发展缓慢。而随着云计算的到来及相关技术的不断成熟推动了数据库行业的快速发展,传统数据库铁打的防线也正在被撕裂。截至目前,全球主流

如何理解腾讯云数据库战略升级?

近日,腾讯云数据库在京正式启动战略升级,宣布未来将聚焦云原生、自治、超融合三大战略方向,以用户为中心,联接未来。并在现场面向全球用户同步发布五大战略级新品,包括数据库智能管家DBbrain、云数据库T

深度盘点丨华为云数据库布局及研发路线图

“华为是个可怕的对手,一旦下定决心做某件事,鲜有做不成的。”这句在圈内少有达成共识的话,也正在一步一步得到应验。很多人或许以为,华为的优势并非软件而是硬件,但其实在数据库软件领域,华为也玩得风生水起华

兴业数金云数据库应用与实践

摘要:本文主要介绍兴业数金云数据库设计、优化、及运维实践,如何利用云数据库为企业创建核心价值,如何在云时代面对海量MySQL、Oracle、Informix服务的运维挑战。作者:林春编辑:张晓艺林春,

专访腾讯云数据库负责人丁奇:打造超越用户想象的产品

“就市场份额来说,腾讯云在国内还不是第一名,但从国内上云企业比例看,剩余的还有很多,因此,大家都还有机会,就看谁能真正解决用户的痛点。”