mysql集群分表怎么分 mysql集群架构部署方案( 二 )


分表理由:根据数据量的规模来划分,保证单表的容量不会太大,从而来保证单表的查询等处理能力 。
案例:同上面的例子,博客系统 。当博客的量达到很大时候 , 就应该采取横向分割来降低每个单表的压力,来提升性能 。例如博客的冷数据表,假如分为100个表,当同时有100万个用户在浏览时,如果是单表的话,会进行100万次请求,而现在分表后,就可能是每个表进行1万个数据的请求(因为,不可能绝对的平均,只是假设),这样压力就降低了很多很多 。
延伸:为什么要分表和分区?
日常开发中我们经常会遇到大表的情况,所谓的大表是指存储了百万级乃至千万级条记录的表 。这样的表过于庞大 , 导致数据库在查询和插入的时候耗时太长,性能低下,如果涉及联合查询的情况 , 性能会更加糟糕 。分表和表分区的目的就是减少数据库的负担 , 提高数据库的效率,通常点来讲就是提高表的增删改查效率 。
什么是分表?
分表是将一个大表按照一定的规则分解成多张具有独立存储空间的实体表,我们可以称为子表,每个表都对应三个文件,MYD数据文件,.MYI索引文件 , .frm表结构文件 。这些子表可以分布在同一块磁盘上,也可以在不同的机器上 。app读写的时候根据事先定义好的规则得到对应的子表名,然后去操作它 。
什么是分区?
分区和分表相似,都是按照规则分解表 。不同在于分表将大表分解为若干个独立的实体表,而分区是将数据分段划分在多个位置存放,可以是同一块磁盘也可以在不同的机器 。分区后 , 表面上还是一张表,但数据散列到多个位置了 。app读写的时候操作的还是大表名字,db自动去组织分区的数据 。
**MySQL分表和分区有什么联系呢?**
1、都能提高mysql的性高,在高并发状态下都有一个良好的表现 。
2、分表和分区不矛盾,可以相互配合的,对于那些大访问量,并且表数据比较多的表,我们可以采取分表和分区结合的方式(如果merge这种分表方式,不能和分区配合的话,可以用其他的分表试),访问量不大,但是表数据很多的表 , 我们可以采取分区的方式等 。
3、分表技术是比较麻烦的,需要手动去创建子表,app服务端读写时候需要计算子表名 。采用merge好一些,但也要创建子表和配置子表间的union关系 。
4、表分区相对于分表,操作方便,不需要创建子表 。
我们知道对于大型的互联网应用,数据库单表的数据量可能达到千万甚至上亿级别,同时面临这高并发的压力 。Master-Slave结构只能对数据库的读能力进行扩展,写操作还是集中在Master中,Master并不能无限制的挂接Slave库,如果需要对数据库的吞吐能力进行进一步的扩展,可以考虑采用分库分表的策略 。
**1、分表**
在分表之前,首先要选中合适的分表策略(以哪个字典为分表字段,需要将数据分为多少张表),使数据能够均衡的分布在多张表中,并且不影响正常的查询 。在企业级应用中,往往使用org_id(组织主键)做为分表字段 , 在互联网应用中往往是userid 。在确定分表策略后,当数据进行存储及查询时,需要确定到哪张表里去查找数据,
数据存放的数据表 = 分表字段的内容 % 分表数量
**2、分库**
分表能够解决单表数据量过大带来的查询效率下降的问题,但是不能给数据库的并发访问带来质的提升,面对高并发的写访问,当Master无法承担高并发的写入请求时,不管如何扩展Slave服务器,都没有意义了 。我们通过对数据库进行拆分,来提高数据库的写入能力,即所谓的分库 。分库采用对关键字取模的方式,对数据库进行路由 。

推荐阅读