Mycat|《Mycat分布式数据库架构》之数据切分实战数据库架构|数据库|Mycat|分布式

文章目录

- - 1、引言
  - 2、前期准备
  - - 2.1 系统环境
    - 2.2 数据库集群
  - 3 注意事项
  - - 3.1 分片原则
    - 3.2 如何选择分片键
  - 4 数据切分实战
  - - 4.1 配置访问用户及权限
    - 4.2 配置逻辑库及逻辑表
    - 4.3 配置分片规则
    - - 4.3.1 简单取模分片
      - 4.3.2 哈希取模分片
      - 4.3.3 枚举分片
      - 4.3.4 字符串范围取模分片

前文回顾：
《Mycat分布式数据库架构》之原理及架构
《Mycat分布式数据库架构》之搭建详解
《Mycat分布式数据库架构》之配置详解
《Mycat分布式数据库架构》之数据切分和读写分离
《Mycat分布式数据库架构》之故障切换

1、引言
本文将建立一个人事管理的数据库，使用水平拆分来做实际演示，并且后期解决分片后的一些问题，比如分片导致的跨库join等问题，以达到一个进阶实战的效果。

2、前期准备
2.1 系统环境我的虚拟机配置如下。
系统：CentOS 7 64位
内存：3GB
硬盘：80GB

2.2 数据库集群数据库我部署了两个数据节点，环境说明如下所示：

ip	角色	数据库
192.168.157.129	Mycat
192.168.157.129	Oracle	human
192.168.157.130	Oracle	human

这里我在两台服务器上安装部署了oracle数据库，并在其中一台服务器部署了mycat。
为了方便后期切分示例演示，需要先了解数据库表结构，首先在linux中先为数据库创建用户，sqlplus命令如下。

CONNECT sys/pwd @human_res AS SYSDBA;

CREATE USER human IDENTIFIED BY human DEFAULT TABLESPACE USERS; GRANT CONNECT,RESOURCE,CREATE VIEW TO human;

创建一个人事管理系统数据库来进行实战演示，创建表语句如下
REGIONS表：

CREATE TABLE REGIONS( REGION_ID NUMBER PRIMARY KEY, REGION_NAME VARCHAR2(25) ) TABLESPACE USERS;

COUNTRIES表：

CREATE TABLE COUNTRIES( COUNTRY_ID CHAR(2) PRIMARY KEY, COUNTRY_NAME VARCHAR2(40), REGION_ID NUMBER REFERENCES REGIONS(REGION_ID) ) TABLESPACE USERS;

LOCATIONS表：

CREATE TABLE LOCATIONS( LOCATION_ID NUMBER PRIMARY KEY, STREET_ADDRESS VARCHAR2(40), POSTTAL_CODE VARCHAR2(12), CITY VARCHAR2(30) NOT NULL, STATE_PROVINCE VARCHAR2(25), COUNTY_ID CHAR(2) REFERENCES COUNTRIES(COUNTRY_ID) ) TABLESPACE USERS;

DEPARTMENTS表：

CREATE TABLE DEPARTMENTS( DEPARTMENT_ID NUMBER(4) PRIMARY KEY, DEPARTMENT_NAME VARCHAR2(30) NOT NULL, MANAGER_ID NUMBER(6), LOCATION_ID NUMBER(4) REFERENCES LOCATIONS(LOCATION_ID) ) TABLESPACE USERS;

JOBS表：

CREATE TABLE JOBS( JOB_ID VARCHAR2(10) PRIMARY KEY, JOB_TITLE VARCHAR2(35) NOT NULL, MIN_SALARY NUMBER(6), MAX_SALARY NUMBER(6) ) TABLESPACE USERS;

EMPLOYEES表：

CREATE TABLE EMPLOYEES( EMPLOYEE_ID NUMBER(6) PRIMARY KEY, FIRST_NAME VARCHAR2(20), LAST_NAME VARCHAR2(25) NOT NULL, EMAIL VARCHAR2(25) NOT NULL UNIQUE, PHONE_NUMBER VARCHAR2(20), HIRE_DATE DATE NOT NULL, JOB_ID VARCHAR2(10) NOT NULL REFERENCES JOBS(JOB_ID), SALARY NUMBER(8,2) CHECK (SALARY>0), COMMISSION_PCT NUMBER(2,2), MANAGER_ID NUMBER(6,0), DEPARTMENT_ID NUMBER(4,0) REFERENCES DEPARTMENTS(DEPARTMENT_ID) ) TABLESPACE USERS;

JOB_HISTORY表：

CREATE TABLE JOB_HISTORY( EMPLOYEE_ID NUMBER(6) NOT NULL REFERENCES EMPLOYEES(EMPLOYEE_ID), START_DATE DATE NOT NULL, END_DATE DATE NOT NULL, JOB_ID VARCHAR2(10) NOT NULL REFERENCES JOBS(JOB_ID), DEPARTMENT_ID NUMBER(4) REFERENCES DEPARTMENTS(DEPARTMENT_ID), CONSTRAINT JHIST_DATE_INTERVAL CHECK (END_DATE>START_DATE), CONSTRAINT JHIST_EMP_ID_ST_DATE_PK PRIMARY KEY (EMPLOYEE_ID,START_DATE) ) TABLESPACE USERS;

SAL_GRADES表：

CREATE TABLE SAL_GRADES( GRADE NUMBER PRIMARY KEY, MIN_SALARY NUMBER(8,2), MAX_SALARY NUMBER(8,2) ) TABLESPACE USERS;

USERS表：

CREATE TABLE USERS( USER_ID NUMBER(2) PRIMARY KEY, USER_NAME CHAR(20), PASSWORD VARCHAR2(20) NOT NULL ) TABLESPACE USERS;

为了方便后面演示全局自增ID，这里将EMPLOYEES表的EMPLOYEE_ID设置为自增ID，如下，创建一个名为“EMPLOYEES_SEQ”的序列，起始值为100，步长为1，不缓存，不循环。

CREATE SEQUENCE EMPLOYEES_SEQ START WITH 100 INCREMENT BY 1 NOCACHE NOCYCLE;

接着创建触发器，如下：

CREATE OR REPLACE TRIGGER EMPLOYEES_SEQ_TRG BEFORE INSERT ON EMPLOYEES FOR EACH ROW WHEN (NEW.EMPLOYEE_ID IS NULL) BEGIN SELECT EMPLOYEES_SEQ.NEXTVAL INTO :NEW.EMPLOYEE_ID FROM DUAL; END;

我们可以使用navicat来连接mycat，这样就可以方便对数据进行操作，连接mycat的方式和连接mysql方式相同，点击连接，选择mysql，然后填写如下信息。

文章图片

其中端口是在mycat的server.xml文件中配置的端口，默认8066；用户名密码也是在server.xml文件中配置的访问用户和密码，连接成功后即可看到配置的逻辑库和逻辑表，如下。

文章图片

mycats 就是逻辑库，employees便是配置的逻辑表，目前对于应用程序来说和普通数据库没什么区别，无需关系底层物理数据库，只是当前逻辑数据库中只有一个表，其余表还需全部进行配置。

3 注意事项
3.1 分片原则

能不切分尽量不要切分。
选择合适的切分规则和分片键。
尽量避免跨分片JOIN操作。

3.2 如何选择分片键

尽可能的比较均匀的分配到各个数据节点中。
该业务字段是最频繁的或最重要的查询条件。

4 数据切分实战
4.1 配置访问用户及权限使用server.xml配置访问用户及权限，如下

> 0 1 0 0 300 2 (?:(\s*next\s+value\s+for\s*MYCATSEQ_(\w+))(,|\)|\s)*)+ 00 0 64k 1k 0 384mfalsefalse true yxc123456 mycats user mycats true

4.2 配置逻辑库及逻辑表使用schema.xml配置逻辑库及逻辑表

name="mycats" checkSQLschema="false" sqlMaxLimit="100"> select 1 from dual select 1 from dual 4.3 配置分片规则使用rule.xml 配置分片表的分片规则，根据业务可以灵活的对表使用不同的分片算法（目前已实现十余种不同的分片规则，对应所在源码包为：io.mycat.route.function），或者对表使用相同的算法但具体的参数不同。下面对常用算法分别进行演示。 4.3.1 简单取模分片文章图片简单取模分片-PartitionByMod算法具有以下特性：只能用于分片列为整数类型的表分片列 mod 分片基数类全名：io.mycat.route.function.PartitionByMod 这里我使用EMPLOYEES表来进行分片演示，简单取模分片只能用于整数列，EMPLOYEE_ID已经为自增ID，所以我选择它的外键DEPARTMENT_ID作为分片列，如下，分片规则使用简单取模分片，片数为2。 DEPARTMENT_ID mod-long 2 接着向mycat逻辑库中添加数据，如下文章图片分别查看两个数据节点中的数据，根据取模算法，刚才插入的数据中DEPARTMENT_ID值为10、12、14的取模结果为0，都将插入第一个节点。第一个节点192.168.157.130中数据如下所示文章图片同理，11、13取模结果为1，都将插入第二个节点192.168.157.129中，如下所示。【Mycat|《Mycat分布式数据库架构》之数据切分实战】文章图片对于EMPLOYEES这张表来说，它的主键EMPLOYEE_ID为自增ID，那这里我向mycat插入数据时，底层各节点物理数据库会各自对ID进行自增，所以会出现重复的情况，解决这个问题需要使用全局自增ID,在下文第5点中会进行讲解。 4.3.2 哈希取模分片哈希取模算法就是计算出分片列，然后进行取模计算，从而进行分片存储，例如 Hash('chao dev')%count 哈希取模-PartitionByHashMod算法具有以下特性： ? 可以用于多种数据类型，如字符串，日期等 ? hash（分片列） mod分片基数 ? 类全名：io.mycat.route.function.PartitionByHashMod 这里使用EMPLOYEES表来进行分片演示，选择LAST_NAME列来作为分片列，节点数同样为2。 LAST_NAME mod-long 2 4.3.3 枚举分片枚举分片算法比较简单，就是指定哪些值存储什么数据节点，除此之外还有一个默认节点，没指定的值都将存储进入默认节点中，如下图所示。文章图片枚举分片-PartitionByFileMap算法具有以下特性： ? 可以根据可能的枚举值指定数据存储的位置 ? mycat/conf目录下增加MapFile配置枚举值同对应节点的对应关系 ? 类全名：io.mycat.route.function.PartitionByFileMap 这里使用EMPLOYEES表来进行分片演示，DEPARTMENT_ID列来作为分片列。 DEPARTMENT_ID filemap-emp partition-filemap-emp-init.txt 00 4.3.4 字符串范围取模分片字符串范围取模分片是利用选取的字符串前N个字符来进行ASCII值来求和，然后根据求模基数计算出值，如下所示：文章图片文章图片字符串范围取模分片-PartitionByPrefixPattern算法具有以下特性： ? 可以根据字符串的前N个字符确定数据存储的位置 ? mycat/conf目录下增加MapFile配置枚举值同对应节点的对应关系 ? 类全名：io.mycat.route.function.PartitionByPrefixPattern EMAIL sharding-by-prefix-pattern 128 0prefix-partition-pattern.txt 更多技术干货，请持续关注程序员大佬超。原创不易，转载请注明出处。推荐阅读 SQL创建表期组词汉字期怎么组词丹参能补血吗剑网3聋哑村任务怎么做剑网3聋哑村任务流程苹果11有3d（touch吗苹果11有没有3d touch） IE9.0无法使用迅雷下载文件该怎样处理？消逝的光芒怎么修理武器消逝的光芒利用蓝盾任务无限修理武器技巧清美屹立画室怎么样清美屹立画室官网发生保管合同纠纷怎么办保管合同纠纷案例梦舒雅女裤质量怎么样如何在魔云服务器上添加音乐？魔云服务器怎么加歌剖宫产|剖宫产的婴儿怎么喂——加点母体粪便？ C#中{ get; set; }写法是什么意思购物中心|健康界现场直击：圣熙八号购物中心暂时封闭！罗宋汤的简单做法酸甜开胃，汤汁鲜美，喝着就是享受猎豹浏览器主页被篡改成了毒霸网址大全？解决方法分享苹果拌海蜇怎么做好吃红河在哪里红海在哪里地图数位板驱动下载不了出现“无法安装所需的NET软件包？绘王数位板驱动哪里可以下载？头等舱芝华士沙发质量怎样芝华士沙发怎么样网络安全|网络安全——数据库基础知识网络|UDP/TCP通信小记 java|Spring如何解决循环依赖（从基础到源码讲解） redis|小米面试题（讲一下Redis分布式锁）创建Iceberg表的步骤——《DEEPNOVA开发者社区》分布式原理|分布式数据库理论知识之CAP理论、ACID原则及分布式事务一致性算法 TcaplusDB|腾讯数据库TcaplusDB-中秋花好月又圆缓冲|@Cacheable注解后端|35 设计优秀的分布式锁上一篇：生活|大学开学的第一天——计算机达人成长之路（32）下一篇：学习ASP.NET|学习ASP.NET Core Blazor编程系列二——第一个Blazor应用程序（下）更多... 学习ASP.NET|学习ASP.NET Core Blazor编程系列二——第一个Blazor应用程序（下） Mycat|《Mycat分布式数据库架构》之数据切分实战生活|大学开学的第一天——计算机达人成长之路（32） LeetCode刷题|recording:24. 两两交换链表中的节点毕业季~在校大学生谈谈未来独白|[开学季征文] 时间过得真快，我也是一个“奔三”的人了 C++|大话STL第九期——仿函数(函数对象) LeetCode刷题|recording:59.螺旋矩阵II 大学计算机基础挂了能毕业吗,大学挂科率最高的十个科目，你中枪了吗（）数据结构|课程设计(飞机订票系统) 超全生活百科 it技术 Copyright © 2017-2022 锐客网京ICP备11041112号-41