mysql怎么做分表分库 mysql分表的方法( 二 )


**MySQL分表和分区有什么联系呢?**
1、都能提高mysql的性高,在高并发状态下都有一个良好的表现 。
2、分表和分区不矛盾 , 可以相互配合的 , 对于那些大访问量,并且表数据比较多的表,我们可以采取分表和分区结合的方式(如果merge这种分表方式,不能和分区配合的话 , 可以用其他的分表试),访问量不大 , 但是表数据很多的表,我们可以采取分区的方式等 。
3、分表技术是比较麻烦的,需要手动去创建子表,app服务端读写时候需要计算子表名 。采用merge好一些,但也要创建子表和配置子表间的union关系 。
4、表分区相对于分表,操作方便,不需要创建子表 。
我们知道对于大型的互联网应用,数据库单表的数据量可能达到千万甚至上亿级别,同时面临这高并发的压力 。Master-Slave结构只能对数据库的读能力进行扩展,写操作还是集中在Master中,Master并不能无限制的挂接Slave库,如果需要对数据库的吞吐能力进行进一步的扩展 , 可以考虑采用分库分表的策略 。
**1、分表**
在分表之前,首先要选中合适的分表策略(以哪个字典为分表字段 , 需要将数据分为多少张表) , 使数据能够均衡的分布在多张表中 , 并且不影响正常的查询 。在企业级应用中,往往使用org_id(组织主键)做为分表字段,在互联网应用中往往是userid 。在确定分表策略后 , 当数据进行存储及查询时,需要确定到哪张表里去查找数据,
数据存放的数据表 = 分表字段的内容 % 分表数量
**2、分库**
分表能够解决单表数据量过大带来的查询效率下降的问题,但是不能给数据库的并发访问带来质的提升,面对高并发的写访问,当Master无法承担高并发的写入请求时 , 不管如何扩展Slave服务器,都没有意义了 。我们通过对数据库进行拆分 , 来提高数据库的写入能力,即所谓的分库 。分库采用对关键字取模的方式,对数据库进行路由 。
数据存放的数据库=分库字段的内容%数据库的数量
**3、即分表又分库**
数据库分表可以解决单表海量数据的查询性能问题,分库可以解决单台数据库的并发访问压力问题 。
当数据库同时面临海量数据存储和高并发访问的时候,需要同时采取分表和分库策略 。一般分表分库策略如下:
中间变量 = 关键字%(数据库数量*单库数据表数量)
库 = 取整(中间变量/单库数据表数量)
表 = (中间变量%单库数据表数量)
实例:
1、分库分表
很明显,一个主表(也就是很重要的表,例如用户表)无限制的增长势必严重影响性能,分库与分表是一个很不错的解决途径,也就是性能优化途径 , 现在的案例是我们有一个1000多万条记录的用户表members,查询起来非常之慢,同事的做法是将其散列到100个表中,分别从members0到members99,然后根据mid分发记录到这些表中,牛逼的代码大概是这样子:
复制代码 代码如下:
?php
for($i=0;$i 100; $i++ ){
//echo "CREATE TABLE db2.members{$i} LIKE db1.members
";
echo "INSERT INTO members{$i} SELECT * FROM members WHERE mid%100={$i}
";
}
?
2、不停机修改mysql表结构
同样还是members表,前期设计的表结构不尽合理,随着数据库不断运行 , 其冗余数据也是增长巨大 , 同事使用了下面的方法来处理:
先创建一个临时表:
/*创建临时表*/
CREATE TABLE members_tmp LIKE members
然后修改members_tmp的表结构为新结构,接着使用上面那个for循环来导出数据,因为1000万的数据一次性导出是不对的,mid是主键,一个区间一个区间的导,基本是一次导出5万条吧 , 这里略去了

推荐阅读