亿级数据怎么存mysql 一个亿的数据如何存到数据库

浅谈mysql数据库分库分表那些事-亿级数据存储方案mysql分库分表一般有如下场景
其中1,2相对较容易实现,本文重点讲讲水平拆表和水平拆库,以及基于mybatis插件方式实现水平拆分方案落地 。
在 《聊一聊扩展字段设计》一文中有讲解到基于KV水平存储扩展字段方案,这就是非常典型的可以水平分表的场景 。主表和kv表是一对N关系,随着主表数据量增长,KV表最大N倍线性增长 。
这里我们以分KV表水平拆分为场景
对于kv扩展字段查询,只会根据id + key 或者 id 为条件的方式查询,所以这里我们可以按照id 分片即可
分512张表(实际场景具体分多少表还得根据字段增加的频次而定)
分表后表名为kv_000~kv_511
id % 512 = 1 .... 分到 kv_001,
id % 512 = 2 .... 分到 kv_002
依次类推!
水平分表相对比较容易,后面会讲到基于mybatis插件实现方案
场景:以下我们基于博客文章表分库场景来分析
目标:
表结构如下(节选部分字段):
按照user_id sharding
假如分1024个库,按照user_id % 1024 hash
user_id % 1024 = 1分到db_001库
user_id % 1024 = 2 分到db_002库
依次类推
目前是2个节点,假如后期达到瓶颈,我们可以增加至4个节点
最多可以增加只1024个节点,性能线性增长
对于水平分表/分库后,非shardingKey查询首先得考虑到
基于mybatis分库分表,一般常用的一种是基于spring AOP方式, 另外一种基于mybatis插件 。其实两种方式思路差不多 。
为了比较直观解决这个问题,我分别在Executor 和StatementHandler阶段2个拦截器
实现动态数据源获取接口
测试结果如下
由此可知,我们需要在Executor阶段 切换数据源
对于分库:
原始sql:
目标sql:
其中定义了三个注解
@useMaster 是否强制读主
@shardingBy 分片标识
@DB 定义逻辑表名 库名以及分片策略
1)编写entity
Insert
select
以上顺利实现mysql分库,同样的道理实现同时分库分表也很容易实现 。
此插件具体实现方案已开源:
目录如下:
mysql分库分表,首先得找到瓶颈在哪里(IO or CPU),是分库还是分表,分多少?不能为了分库分表而拆分 。
原则上是尽量先垂直拆分 后 水平拆分 。
以上基于mybatis插件分库分表是一种实现思路,还有很多不完善的地方,
例如:
mysql怎样能建一个可以存储上亿条记录的数据库?如果单讲存储 , 那只要你的硬盘够大都可以 , 但如果要讲效率就得想办法,如根据年份把数据放到不同的表里,或不同的机子上,因为一个表放这么多数据效率会很低的,但如果分开放又会出现统计、去重这类操作的麻烦 , 所以设置数据库不能只考虑三级范式,难的是设置的有效率 。
“mysql”达到1亿级别如何设计优化?“mysql”达到1亿级别如何设计优化?
1.首先可以考虑业务层面优化,即垂直分表 。
垂直分表就是把一个数据量很大的表,可以按某个字段的属性或使用频繁程度分类,拆分为多个表 。
如有多种业务类型,每种业务类型入不同的表,table1,table2,table3.
如果日常业务不需要使用所有数据,可以按时间分表,比如说月表 。每个表只存一个月记录 。
2.架构上的优化,即水平分表 。
水平分表就是根据一列或多列数据的值把数据行放到多个独立的表里,这里不具备业务意义 。
如按照id分表,末尾是0-9的数据分别插入到10个表里面 。
可能你要问,这样看起来和刚才说的垂直分表没什么区别 。只不过是否具备业务意义的差异,都是按字段的值来分表 。

推荐阅读