php数据结构不够丰富 php数据存储( 三 )


所以,当访问量激增的时候,PHP架构的网站会出现的很多问题都因数据库而起 。数据库的同步问题还不算什么 。关键是数据库的响应速度会有指数级的降低 。这个问题我在10月23号LAMP发布会的时候问过MySQL的副总裁 。他当时也没有给我比较完美的答案(这也我的意料之中),因为数据库总会有瓶颈的,除非是神仙数据库,哈哈!
这里有个题外话,LAMP大会的时候我跟Yahoo的一个技术高管聊的时候,我问他Yahoo在选择MySQL还是Oracle的时候是怎么考虑,他的答案令我非常惊讶 。他说大部分的时候我们是会用MySQL的,因为它的性能已经达到我们的要求 。但是什么时候我们会选用Oracle呢,就是当我们需要存储收费用户的数据的时候 。我就问为什么,难道Oracle比MySQL稳定吗?他说,这个倒没有特别考虑 。关键是如果使用Oracle的话,当出现问题的时候我们可以找到负责人,Oracle会负责事故的处理 , 但是如果用MySQL的话,我们找谁去?
所以,我们对数据库的看法应该纠正过来,就是说数据库不是万能的 。如果有实力的话自己开发数据库 。听说Google就是那样的 。
那么我们怎么看待数据库呢?我个人的理解是数据库只是用来降低开发成本的手段 。因为采用数据库以后我们不需要考虑数据的存储,尤其是排序和查找 。但是这会带来什么问题呢?就是当业务膨胀的时候,数据库就成为瓶颈了 。这个时候问题就会非常棘手 。因为这个是底层的数据处理 。牵一发而动全身 。
所以我认为正确的观点是,数据库是一个数据备份机 。怎么理解,我们只需要保证数据的存储有效性就行了 。而这本来就是数据库的核心功能 , 只不过因为数据库的方便的排序等功能让大家把过多的处理都交给数据库来操作了 。一个用户的点击PHP就把一大堆的任务交给数据库,然后把结果排列下给用户就完事了 。这对数据库是不公平的 。也是因此大家开始抱怨数据库的性能了 。
针对这个观点,我们再举个例子 , 有一次我去拜访一个大型的网络公司(基本上国内只要上过互联网的都知道),他们使用PHP很少,但是我了解到他们其它业务是怎么使用数据库 。他们自豪地跟我介绍说他们在数据库的外围有个第二数据库(我这里起名叫第二数据库) 。为什么叫第二数据库呢,原来它是一个缓存系统 。那么开发工程师怎么去这个缓存系统获取数据呢?那个技术总监自豪地说 , 他们这个缓存系统有SQL查询语句 。我当时很惊讶,但是后来想想确实需要这个 。因为当你的缓存系统达到一定量级的时候从缓存获取数据都非常复杂,干脆写个SQL查询语句让缓存系统分析、处理并返回数据 。而且他们告诉我 , 在他们那里,就算是用PHP的话也是让PHP去那个缓存系统读取数据 。
所以说,如果你能处理好这样的问题的话,把数据存放在数据库,然后数据库只起到备份的作用 。然后你用自己的中间层来处理分析数据,效果是90% 以上的用户不访问数据库 。有人就会说了 , 这不就类似连接池的东西吗?是的 , 因为数据库的瓶颈是无法解决的 , 我们只能在Web服务器和数据库中间加个中间层来做缓冲 。
可能大家会说了,切,这个我们早就知道了 。那好 , 这里我要说的是它引发的两点思考:
第一,有些语言已经有连接池技术的基础上 , 那些程序员可以方便地使用连接池而构建大型应用 。那么如果他们认为 PHPer只会是用数据库,那么我们是不是可以说他们只会是用连接池呢?连接池和数据库在这个概念上有何区别?

推荐阅读