php高效处理百万级数据 php千万级数据怎么优化( 四 ) _系统

三、 MySQL数据库机器之间的数据同步
每当我们解决一个问题，新的问题必然诞生在旧的解决方案上。当我们有多台MySQL，在业务高峰期，很可能出现两个库之间的数据有延迟的场景。并且，网络和机器负载等，也会影响数据同步的延迟。我们曾经遇到过，在日访问量接近1亿的特殊场景下，出现，从库数据需要很多天才能同步追上主库的数据。这种场景下，从库基本失去效用了。
于是，解决同步问题，就是我们下一步需要关注的点。
1. MySQL自带多线程同步
MySQL5.6开始支持主库和从库数据同步，走多线程。但是，限制也是比较明显的，只能以库为单位。MySQL数据同步是通过binlog日志，主库写入到binlog日志的操作，是具有顺序的，尤其当SQL操作中含有对于表结构的修改等操作，对于后续的SQL语句操作是有影响的。因此，从库同步数据，必须走单进程。
2. 自己实现解析binlog，多线程写入。
以数据库的表为单位，解析binlog多张表同时做数据同步。这样做的话，的确能够加快数据同步的效率，但是，如果表和表之间存在结构关系或者数据依赖的话，则同样存在写入顺序的问题。这种方式，可用于一些比较稳定并且相对独立的数据表。
国内一线互联网公司，大部分都是通过这种方式，来加快数据同步效率。还有更为激进的做法，是直接解析binlog，忽略以表为单位，直接写入。但是这种做法，实现复杂，使用范围就更受到限制，只能用于一些场景特殊的数据库中（没有表结构变更，表和表之间没有数据依赖等特殊表）。
四、在Web服务器和数据库之间建立缓存
实际上，解决大访问量的问题，不能仅仅着眼于数据库层面。根据“二八定律” ， 80%的请求只关注在20%的热点数据上。因此，我们应该建立Web服务器和数据库之间的缓存机制。这种机制，可以用磁盘作为缓存，也可以用内存缓存的方式。通过它们，将大部分的热点数据查询，阻挡在数据库之前。
1. 页面静态化
用户访问网站的某个页面，页面上的大部分内容在很长一段时间内，可能都是没有变化的。例如一篇新闻报道，一旦发布几乎是不会修改内容的。这样的话，通过CGI生成的静态html页面缓存到Web服务器的磁盘本地。除了第一次，是通过动态CGI查询数据库获取之外，之后都直接将本地磁盘文件返回给用户。
在Web系统规模比较小的时候，这种做法看似完美。但是，一旦Web系统规模变大，例如当我有100台的Web服务器的时候。那样这些磁盘文件，将会有100份，这个是资源浪费，也不好维护。这个时候有人会想，可以集中一台服务器存起来，呵呵，不如看看下面一种缓存方式吧，它就是这样做的。
2. 单台内存缓存
通过页面静态化的例子中，我们可以知道将“缓存”搭建在Web机器本机是不好维护的，会带来更多问题（实际上，通过PHP的apc拓展，可通过Key/value操作Web服务器的本机内存）。因此，我们选择搭建的内存缓存服务，也必须是一个独立的服务。
内存缓存的选择，主要有redis/memcache 。从性能上说，两者差别不大，从功能丰富程度上说，Redis更胜一筹。
3. 内存缓存集群
当我们搭建单台内存缓存完毕，我们又会面临单点故障的问题，因此，我们必须将它变成一个集群。简单的做法，是给他增加一个slave作为备份机器。但是，如果请求量真的很多，我们发现cache命中率不高，需要更多的机器内存呢？因此，我们更建议将它配置成一个集群。例如，类似redis cluster 。

php高效处理百万级数据 php千万级数据怎么优化( 四 )

推荐阅读

鱼缸为什么起泡沫？鱼缸起泡沫了应该如何处理？

大成创新成长基金净值查询大成创新成长基金最新净值

2018年英雄联盟lol剑圣皮肤大全

spring cloud底层分析

念奴娇赤壁怀古翻译及原文念奴娇赤壁怀古诗歌鉴赏

气球飞行家1865事件埃及热气球爆炸

喜欢佳能广告的原因喜欢佳能700d

干萝卜缨怎么做菜

瓦尔塔电瓶怎样打开上盖瓦尔塔电瓶拆上盖方法

服务器怎么做虚拟主机怎么样把服务器主机虚拟化

哩多音字组词哩多音字组词语组词

上海属于哪个省份长沙市在哪里

肠道|大脑的健康，也受肠道通透性的影响

奶茶放冰箱冷藏过夜第二天可以喝么

下体有异味怎么解决来完姨妈下体有异味怎么解决

交强险合同可以变更吗

flutterpageview翻书的简单介绍

手工业有哪些

为什么有春雨贵如油春雨贵如油说法的解释

2023广州长隆野生动物园5月门票多少钱