OceanBase:分布式数据库“布道者”

一点财经邱韵2021-09-15 08:20 大公司
操作系统、芯片、数据库,是IT三大重要部分,也是中国创新企业发展的三大拦路虎。曾经,它们的共同特性是被国外厂商所占据,中国企业只能在此基础上做优化和调整。如今,操作系统和芯片国产化已经在路上,数据库国产化正在崛起。

最近的数据库行业热闹非常。

一边是国产数据库崛起的声音。《2020网信自主创新调研报告》显示,国产数据库在国内的市场份额提升至8%-10%,在党政、金融、电信等多个关键领域开始规模化应用。在Gartner发布的2020 年度全球数据库魔力象限中,中国数据库首次进入第一象限。

在数据库于金融、电信这些“重”、“大”领域驰骋的同时,一些声音被忽略了——“自建数据库的成本大吗?有没有必要选择自建数据库?”它们来自中国大量的中小企业,对它们来说,这些问题相当迫切,也相当普遍。

9月11日,全球创业者峰会上有人将这两种“声音”聚合到了一起。蚂蚁集团旗下独立的数据库公司北京奥星贝斯(OceanBase)发布了“创计划”,首期全免费为100家中小企业提供数据库升级服务。

在数据库的国产化之路上,中小企业们从不是无关紧要的角色,甚至是重要的推动者,OceanBase明白这个道理。

Image

开放者

9月10日、11日,全球创业者峰会在北京召开。就在这个会议的前两天,北京市召开优化营商环境“十四五”规划新闻发布会,讲述了一系列对中小企业的扶持计划。时间再往前,是扶持“专精特新”中小企业的北交所成立。

在这个意义非凡的大会上,一家刚成立一年名为OceanBase的数据库企业被邀请参加主论坛发言。9月11日,OceanBase(以下简称“OB”)的CEO杨冰发布了一个相当“大胆”的计划,免费帮中小企业提供数据库服务,首期开放100个名额。

Image

在他的计划中,这只是OB创计划的首期,希望通过首期这100个样本总结出一套为中小企业技术服务的模版,从而在接下来二期三期中更好地服务更多的中小企业。

数据库同芯片、操作系统一道,都是相当重要的IT软件,甚至有人说“没有数据库,就没有企业的根本”。但在这个投资人眼中快公司才有价值的年代,对创业者和中小企业来说,底层技术的搭建注定漫长,从0开始难于登天,很多人只能求助于开源或免费数据库。

OB的创计划,针对的就是这些中小企业。除了1T数据量以外,这个计划没有门槛,“只要报了名说是我们的开源客户,希望得到帮助,我们就会派出专业的人员去做架构咨询,去教如何使用,帮助客户上线后也会再提供一些售后保障机制”,杨冰向《一点财经》表示。

其实,早在3个月前,OB还做了一件大事,那就是开源。

今年6月1日,OB采用木兰协议全面开放内核,在Gitee、Github上进行代码托管,同时成立OceanBase开源社区,300万行核心代码向社区开放。以此,OB从闭源软件走向了开源。

在开源、创计划连续两个动作背后,OB正在走出蚂蚁,变得越来越开放。它开放的底气何在?

Image

革命者

“看着同样是车,但其实特斯拉和油车不是一个时代的产物,未来特斯拉可能就没有方向盘了”,9月10日,杨冰在北京新国展附近向《一点财经》如此通俗地解释OB的分布式数据库与其他数据库质的不同。

OB成立得比特斯拉还早,至今已有十一年的时间,但同特斯拉一样,OB生于“不满足”。那时,淘宝还没有腾飞,蚂蚁还在初创,但一些东西正在悄悄萌芽,其中就有2010年成立的OB。

当时的数据库有两个背景:第一,数据库技术本质上受场景驱动,上世纪开始IT行业最先发展起来的美国也最先发展起了数据库,随后几乎垄断了全球数据库行业。第二,随着21世纪以来中国计算机行业的快速发展乃至超越,中国有了革新数据库的行业基础和诉求。

淘宝是做电商的,随着电商业务的推进,曾任淘宝高级研究员的阳振坤发现了一个现象:传统数据库处理的是封闭物理世界的场景,但像淘宝这样的线上商城没有物理边界,无论是数据量、请求量、访问用户都是天南地北不被限制的,因此必须打破并重新设计数据库。

“做这个的初心其实是做一个未来的数据库,阳老师(阳振坤)认为现在的数据库技术很难去适应未来的时代。第二也是有情怀在,总觉得在中国的软件领域也应该有一些比较硬核的自主品牌出现,而数据库是软件当中除操作系统以外最难的。”杨冰如此解释OB的由来。

一开始,他们想基于一个开源数据库去重新设计,但对市面上的数据库摸了一圈之后,发现找不到符合自己要求的,顶层设计不一样,所以开始从0开始设计出OB。它基于Paxos 协议和分布式架构,构建在通用服务器集群上,不依赖特定硬件架构。

重新设计的OB,可能使用感跟传统数据库一样,但内核里已完全不同,杨冰用“scale out”(线性扩展)和“scale up”(增大)两个词汇来描述两者的差异。

传统数据库像一辆燃油车一样,当觉得马力不足的时候可以scale up,装更多的配件,从8缸到12缸,但再怎么多装,都只能在车的容限里。而OB可以scale out实现线性扩展,能力不够了可以加服务器,单个硬件本身的能力没那么强,但整合起来没有天花板。

“我们用分布式数据库通过了传统集中式数据库最严苛的测试标准,甲骨文做到了每秒钟3000万,而我们做到7.07亿,成为唯一在事务处理和数据分析两个领域测试中都刷新世界记录的中国自研数据库。”全球创业者峰会上,杨冰介绍道。

生长土壤的根本性差异,决定了OB的革命性不同。与传统数据库相比,OB能够帮企业降低50%-80%的成本,规模越大,降低效果越明显。

Image

走出蚂蚁

对分布式数据库来说,一致性是重要考验,而OB通过采用Paxos 协议解决了一致性问题。Paxos这个理论最早由科学家Lamport提出,后来Google的工程师基于此做了分布式数据库。现在OB基于金融级场景的打磨会在一致性和延迟方面做的更极致。

蚂蚁做的是支付,谷歌做的是搜索场景,也就无法在金融这样的场景中将一致性做到极致。“我们用了同样一套论文里面的理念,用自己的方式重新再实现一遍,虽然参照一样的东西,但放在支付宝这种场景里就可以模拟出来,可以做得更强”,杨冰表示。

虽然现在分布式数据库成为行业公认的未来,成为兵家必争之地,但其实一开始,哪怕在蚂蚁内部,对数据库应该怎么走,哪个方向才是未来这些问题都是有疑惑的,在阿里和蚂蚁内部,做数据库的团队也不只一个。OB就是在这种千军万马过独木桥的氛围中一路走过来,研发最艰难的时候,几乎就没有人敢用OB,团队也经历过至暗时刻,但最终还是熬出来了,并最终取得了胜利。

除了技术先进性和路线的正确性,OB的发展还离不开蚂蚁等业务场景的支持。一开始淘宝收藏夹最先表达了对OB的支持,但当时的OB还没有那么强,找到一两个场景后无法继续推广了,阳振坤向阿里云计算创始人王坚求助,后者帮忙说服了当时的蚂蚁集团CTO程立。

那时,蚂蚁集团可以说是当时中国使用Oracle最多的一家互联网公司,而蚂蚁又在实行去IOE(Oracle 的标配是 IBM 的小型机和 EMC 的存储硬件)战略,需要找到替代的数据库,尤其是自己的数据库。

OB第一次在蚂蚁的亮相可谓完美。蚂蚁原本计划给OB 1%的业务量,但预估之后发现Oracle扛不住,最后给了OB10%的业务量。“这个时候OB也没有别的选择,就来吧,结果OB顶过去了,一战成名,走过了至暗时刻”,杨冰回忆道。

OB的发展到可以分为三个阶段,1.0时代是从2010年成立到找到淘宝收藏夹,再转战支付宝第一个核心交易系统上线;2.0时代是在支付宝内部不断打磨金融场景,实现支付宝核心业务对Oracle的替换,得到外部客户的认可;3.0时代是正式走出蚂蚁。

2020年6月,随着内部打磨和考验的完成,OB开始走出蚂蚁,在北京成立独立公司,除了蚂蚁时期就十分上手的金融企业,还开始接触运营商、能源电力等传统企业,以及跨境电商等互联网企业,甚至开始有海外企业合作。

在杨冰看来,过去十年OB是通过内部 “喂”出来、磨出来的,未来随着走出蚂蚁,进一步打磨OB的产品成熟度,把它推向世界。

Image

数据库国产化野心

阳振坤常常提到一个说法,一个技术产品要长远发展,必须“顶天立地”,所谓“顶天”,是技术先进性,所谓“立地”,是产品化、商业化、通用化。毫无疑问,OB是“顶天立地”的信奉者。

OB走出蚂蚁的过程,其实就是它产品化、商业化的过程。

对一个以技术为基石的企业来说,这无疑是相当有挑战性的。扛起OB产品化、商业化重任的杨冰,就直言经历了一两年的过渡期。“从去年成立一个商业化团队之后,我们在决策导向和引导导向上强调客户第一,让大家做事情不要自high。”

原来,技术埋头做技术就好,但现在,他们不得不更多地听来自外界的声音,走出办公室,去客户企业里听从他们的需求和声音,在客户要求下做产品的改进。曾经技术为主的30人团队,如今发展成500人,其中有专精技术的,也有既懂技术也懂产品的复合型人才。

OB策略一开始是高举高打,树立标杆,它合作的企业中有银行、证券、石油、电力、运营商等企业,都算是大型企业,也是对数据和技术要求高的企业。截至目前,OB合作了上百家企业。

随着今年开源和“创计划”的实施,OB的步子越迈越大。杨冰向《一点财经》透露,明年OB计划推出4.0版本,其特性是轻量化更好,会更适合中小微企业。“到时,OB会像金箍棒一样,能长就长,能短就短。”

通过一高一低两端共同推进,OB在做大企业时,争取更多的认同者、追随者,在中国乃至全球进行分布式数据库布道,共同推进国产分布式数据库的发展,改变数据库为外国企业引领乃至占据的局面,这是OB的数据库国产化梦想。

近二三十年,数字世界欣欣向荣,无论个人还是企业都放弃了纸笔,将电脑和软件作为了生产工具,在持续的产业数字化背景下,数据库的重要性不言而喻。自一开始就生于“不满足”的OB,想做得更“出格”一点。

要实现这个终极目标,推动国产数据库,首先要做的是长期保持技术的先进性。据杨冰所说, OB是产品先行,会长期遵行技术优先。

Image

结语

操作系统、芯片、数据库,是IT三大重要部分,也是中国创新企业发展的三大拦路虎。曾经,它们的共同特性是被国外厂商所占据,中国企业只能在此基础上做优化和调整。如今,操作系统和芯片国产化已经在路上,数据库国产化正在崛起。

中国全球领先的互联网、数据产业,为数据库的国产化提供了天然土壤。弯道超车,最有可能在这里实现。

【本文为合作媒体授权博望财经转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表博望财经立场,转载请联系原作者及原出处获得授权。有任何疑问都请联系(联系(微信公众号ID:AppleiTree)。免责声明:本网站所有文章仅作为资讯传播使用,既不代表任何观点导向,也不构成任何投资建议。】

猜你喜欢