投稿|这群程序员为何坚持30年“免费”写代码?( 二 )
它就像地基,为计算机上的软件使用提供最基本的底层架构 。但当时,顶尖的数据库都来自美国,其中又以甲骨文的Oracle数据库的使用最为广泛 。
在那一年,线上购物平台淘宝的同时访问量已达到百万量级,庞大的数据量就需要购买Oracle庞大的数据库,而这笔支出是惊人的 。
时任阿里首席技术官的王坚算了一笔账,把1万亿元GMV折算成数据量,再折算成需要的IBM小型机数量、Oracle数据库量、EMC存储数量,再换算成具体价格相加,得到他们每年需要给IOE的采购费200亿元 。
这笔钱甚至超过他们每年所赚的利润 。
【投稿|这群程序员为何坚持30年“免费”写代码?】从那个时刻开始,数据库的自建被提上了议程 。阳振坤授命开启了自建数据库OceanBase项目的道路 。
文章图片
图 | 阳振坤和OceanBase早期团队在一起
当时,业内领先的五大数据库里,有两个数据库是开源的 。较为简便的方法是直接把开源数据库的代码拿来修改和使用 。但作为OceanBase的创始人,阳振坤拒绝这样做 。
加入阿里前,阳振坤从事分布式系统研发,加入阿里后,摆在他面前的有两条路:一是加入正在快速发展的淘宝业务团队,主管技术,这是一条已经能看到很大的发展机会、相对清晰的道路;但阳振坤选择了另外一条道路:从头组建团队做一个技术平台,把OceanBase数据库做出来 。
一方面,当时主流的数据库都是集中式分布数据库,根本无法适应大规模、同时性的数据访问,但当时淘宝的同时使用人数已达数百万,继续用集中式分布数据库,承载困难,且造价很高(集中式分布的数据处理和存储通常设在高端服务器和高端存储设备上,成本很高);另一方面,阳振坤也想做出中国自己的数据库 。
他提出了分布式数据库的理念:在数据库内把数据切小,放到多台计算机上 。只要大多数计算机运转正常,数据就能够得到保障 。
同时,因为硬件采用的PC机,成本也会降低 。另一方面,他把数据库的两大功能:记账和数据分析,组合在了一起,以往需要用到两个不同的数据库系统来满足的功能,在阳振坤的构建里成为了一个一站式解决方案 。
这个构想当然很好,但要真正建立,却需要至少好几年的时间,业务不等人 。
阳振坤只能在这个体系构想之下,每次逐步迭代一点点的功能,小步快跑地把整个体系构建起来 。
他一个一个地跑业务部门,终于找到收藏夹有一个数据库的需求 。
用户在淘宝进入收藏夹后,都会调取数据库 。收藏夹是用户常用的功能,基于淘宝当时的使用人数,收藏夹所涉及到的数据十分庞大,用Oracle非常昂贵,因此成为业务部门的一个烫手山芋,也成了阳振坤能证明OceanBase的开始 。
阳振坤接下了这个需求,用2个月做了模型,6个月投入使用 。
从这时开始,阳振坤的OceanBase逐渐证明着自己 。从一个基础的收藏夹需求,到2014年双十一Oracle崩溃,OceanBase临危受命承担支付宝10%的交易流水,再到承担支付宝100%的交易 。阳振坤用十年的时间,终于搭建起了中国人自己研发的数据库 。
这个数据的地基,才算真的被夯实了起来 。
“主流的五大数据库里,最晚出现的是MySQL,1996年,此后这么多年,数据库领域一直没有大的更新 。因为数据库做起来本身非常复杂、耗时很久,需要一些很优秀的人,一直持续不断地投入,十年才能见成效 。”
推荐阅读
- 投稿|一年亏掉53亿美金,谷歌在医疗健康领域如何踩坑
- 投稿|奢侈品选代言人,更难了
- 投稿|帅农鸟哥火了,然后呢?
- 投稿|生态链不是小米的解药
- 投稿|茅台为什么越控价越涨价?
- 投稿|QuestMobile 2021 年移动互联网黑马盘点报告
- 投稿|顺丰不能再犯错
- 投稿|创投4万亿,中国银发经济将迎来黄金30年
- 投稿|安踏DTC,只撑起了半边天
- 投稿|“我朋友年薪百万,在盒马捞鱼”,一文看懂新零售的「哆啦A梦」