投稿|这群程序员为何坚持30年“免费”写代码？( 二 ) 投稿

它就像地基，为计算机上的软件使用提供最基本的底层架构。但当时，顶尖的数据库都来自美国，其中又以甲骨文的Oracle数据库的使用最为广泛。
在那一年，线上购物平台淘宝的同时访问量已达到百万量级，庞大的数据量就需要购买Oracle庞大的数据库，而这笔支出是惊人的。
时任阿里首席技术官的王坚算了一笔账，把1万亿元GMV折算成数据量，再折算成需要的IBM小型机数量、Oracle数据库量、EMC存储数量，再换算成具体价格相加，得到他们每年需要给IOE的采购费200亿元。
这笔钱甚至超过他们每年所赚的利润。
【投稿|这群程序员为何坚持30年“免费”写代码？】从那个时刻开始，数据库的自建被提上了议程。阳振坤授命开启了自建数据库OceanBase项目的道路。

文章图片

图 | 阳振坤和OceanBase早期团队在一起
当时，业内领先的五大数据库里，有两个数据库是开源的。较为简便的方法是直接把开源数据库的代码拿来修改和使用。但作为OceanBase的创始人，阳振坤拒绝这样做。
加入阿里前，阳振坤从事分布式系统研发，加入阿里后，摆在他面前的有两条路：一是加入正在快速发展的淘宝业务团队，主管技术，这是一条已经能看到很大的发展机会、相对清晰的道路；但阳振坤选择了另外一条道路：从头组建团队做一个技术平台，把OceanBase数据库做出来。
一方面，当时主流的数据库都是集中式分布数据库，根本无法适应大规模、同时性的数据访问，但当时淘宝的同时使用人数已达数百万，继续用集中式分布数据库，承载困难，且造价很高（集中式分布的数据处理和存储通常设在高端服务器和高端存储设备上，成本很高）；另一方面，阳振坤也想做出中国自己的数据库。
他提出了分布式数据库的理念：在数据库内把数据切小，放到多台计算机上。只要大多数计算机运转正常，数据就能够得到保障。
同时，因为硬件采用的PC机，成本也会降低。另一方面，他把数据库的两大功能：记账和数据分析，组合在了一起，以往需要用到两个不同的数据库系统来满足的功能，在阳振坤的构建里成为了一个一站式解决方案。
这个构想当然很好，但要真正建立，却需要至少好几年的时间，业务不等人。
阳振坤只能在这个体系构想之下，每次逐步迭代一点点的功能，小步快跑地把整个体系构建起来。
他一个一个地跑业务部门，终于找到收藏夹有一个数据库的需求。
用户在淘宝进入收藏夹后，都会调取数据库。收藏夹是用户常用的功能，基于淘宝当时的使用人数，收藏夹所涉及到的数据十分庞大，用Oracle非常昂贵，因此成为业务部门的一个烫手山芋，也成了阳振坤能证明OceanBase的开始。
阳振坤接下了这个需求，用2个月做了模型，6个月投入使用。
从这时开始，阳振坤的OceanBase逐渐证明着自己。从一个基础的收藏夹需求，到2014年双十一Oracle崩溃，OceanBase临危受命承担支付宝10%的交易流水，再到承担支付宝100%的交易。阳振坤用十年的时间，终于搭建起了中国人自己研发的数据库。
这个数据的地基，才算真的被夯实了起来。
“主流的五大数据库里，最晚出现的是MySQL，1996年，此后这么多年，数据库领域一直没有大的更新。因为数据库做起来本身非常复杂、耗时很久，需要一些很优秀的人，一直持续不断地投入，十年才能见成效。”

投稿|这群程序员为何坚持30年“免费”写代码？( 二 )

推荐阅读

电脑导航为什么突然变的卡顿

鬼泣5第八章BOSS是什么鬼泣5第八关BOSS打法说明

贡柑和皇帝柑的区别贡柑和皇帝柑的区别是什么

索纳塔论坛汽车之家索纳塔8论坛汽车之家

OPPOReno新品发布会价格像素等功能汇总 OPPOReno发布会全程直播观看方法

win7怎么初始化硬盘

装修面积是怎么计算的,装修全包如何计算面积装修面积是怎么计算的

Vue中微信支付的实例

pytorch|BERT、ALBERT模型加载——From pytorch_model.bin

银耳早上吃还是晚上吃

绿豆汤有减肥效果吗

电蚊香有毒吗

vb.net折叠项 vs折叠if

风行电视怎么投屏

neo4j数据库的连接 neo4j和mysql的优缺点

博世壁挂炉开暖气不启动怎么解除博世壁挂炉生活热水不加热什么原因 ,这是什么故障

2262年两个春节日历是真的吗 2262年两个春节日历表

港媒（三叶草智慧校园系统将广泛应用于内地中小学信息化管理）

福州评话的唱调有哪些福州评话的唱调都有什么

中核二三属于什么行业