数据库批量插入这么讲究的么（） java数据库批量插入

最近新的项目写了不少各种 insertBatch 的代码，一直有人说，批量插入比循环插入效率高很多，那本文就来实验一下,到底是不是真的？
测试环境：

SpringBoot 2.5
Mysql 8
JDK 8
Docker

首先，多条数据的插入，可选的方案：

foreach循环插入
拼接sql，一次执行
使用批处理功能插入

搭建测试环境` 【数据库批量插入这么讲究的么（）】sql文件：

drop database IF EXISTS test; CREATE DATABASE test; use test; DROP TABLE IF EXISTS `user`; CREATE TABLE `user` ( `id` int(11) NOT NULL, `name` varchar(255) DEFAULT "", `age` int(11) DEFAULT 0, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

应用的配置文件：

server: port: 8081 spring: #数据库连接配置 datasource: driver-class-name: com.mysql.cj.jdbc.Driver url: jdbc:mysql://127.0.0.1:3306/test?characterEncoding=utf-8&useSSL=false&allowPublicKeyRetrieval=true&&serverTimezone=UTC&setUnicode=true&characterEncoding=utf8&&nullCatalogMeansCurrent=true&&autoReconnect=true&&allowMultiQueries=true username: root password: 123456 #mybatis的相关配置 mybatis: #mapper配置文件 mapper-locations: classpath:mapper/*.xml type-aliases-package: com.aphysia.spingbootdemo.model #开启驼峰命名 configuration: map-underscore-to-camel-case: true logging: level: root: error

启动文件，配置了Mapper文件扫描的路径：

import org.mybatis.spring.annotation.MapperScan; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.EnableAutoConfiguration; import org.springframework.boot.autoconfigure.SpringBootApplication; @SpringBootApplication @MapperScan("com.aphysia.springdemo.mapper") public class SpringdemoApplication {public static void main(String[] args) { SpringApplication.run(SpringdemoApplication.class, args); }}

Mapper文件一共准备了几个方法，插入单个对象，删除所有对象，拼接插入多个对象：

import com.aphysia.springdemo.model.User; import org.apache.ibatis.annotations.Param; import java.util.List; public interface UserMapper {int insertUser(User user); int deleteAllUsers(); int insertBatch(@Param("users") Listusers); }

Mapper.xml文件如下：

insertinto user(id,age) values(#{id},#{age}) delete from user where id>0; insert into user(id,age) VALUES (#{model.id}, #{model.age})

测试的时候，每次操作我们都删除掉所有的数据，保证测试的客观，不受之前的数据影响。
不同的测试 1. foreach 插入
先获取列表，然后每一条数据都执行一次数据库操作，插入数据：

@SpringBootTest @MapperScan("com.aphysia.springdemo.mapper") class SpringdemoApplicationTests {@Autowired SqlSessionFactory sqlSessionFactory; @Resource UserMapper userMapper; static int num = 100000; static int id = 1; @Test void insertForEachTest() { List users = getRandomUsers(); long start = System.currentTimeMillis(); for (int i = 0; i < users.size(); i++) { userMapper.insertUser(users.get(i)); } long end = System.currentTimeMillis(); System.out.println("time:" + (end - start)); } }

2. 拼接sql插入
其实就是用以下的方式插入数据：

INSERT INTO `user` (`id`, `age`) VALUES (1, 11), (2, 12), (3, 13), (4, 14), (5, 15);

@Test void insertSplicingTest() { List users = getRandomUsers(); long start = System.currentTimeMillis(); userMapper.insertBatch(users); long end = System.currentTimeMillis(); System.out.println("time:" + (end - start)); }

3. 使用Batch批量插入
将MyBatis session 的 executor type 设为 Batch ，使用sqlSessionFactory将执行方式置为批量，自动提交置为false,全部插入之后，再一次性提交：

@Test public void insertBatch(){ SqlSession sqlSession = sqlSessionFactory.openSession(ExecutorType.BATCH, false); UserMapper mapper = sqlSession.getMapper(UserMapper.class); List users = getRandomUsers(); long start = System.currentTimeMillis(); for(int i=0; i




 
 4. 批量处理+分批提交


 
 在批处理的基础上，每1000条数据，先提交一下，也就是分批提交。


 
 @Test
public void insertBatchForEachTest(){
SqlSession sqlSession = sqlSessionFactory.openSession(ExecutorType.BATCH, false);

UserMapper mapper = sqlSession.getMapper(UserMapper.class);

List users = getRandomUsers();

long start = System.currentTimeMillis();

for(int i=0;
i



 
 初次结果，明显不对？ 
 运行上面的代码，我们可以得到下面的结果，for循环插入的效率确实很差，拼接的sql效率相对高一点，看到有些资料说拼接sql可能会被mysql限制，但是我执行到1000w的时候，才看到堆内存溢出。


 
 下面是不正确的结果！！！


 
  
 
 
插入方式 
10 
100 
1000 
1w 
10w 
100w 
1000w 
 
 
 
 
for循环插入 
387 
1150 
7907 
70026 
635984 
太久了... 
太久了... 
 
 
拼接sql插入 
308 
320 
392 
838 
3156 
24948 
OutOfMemoryError: 堆内存溢出 
 
 
批处理 
392 
917 
5442 
51647 
470666 
太久了... 
太久了... 
 
 
批处理 + 分批提交 
359 
893 
5275 
50270 
472462 
太久了... 
太久了... 
 
 
  
 拼接sql并没有超过内存


 
 我们看一下mysql的限制:


 
 mysql> show VARIABLES like '%max_allowed_packet%';

+---------------------------+------------+
| Variable_name| Value|
+---------------------------+------------+
| max_allowed_packet| 67108864|
| mysqlx_max_allowed_packet | 67108864|
| slave_max_allowed_packet| 1073741824 |
+---------------------------+------------+
3 rows in set (0.12 sec)



 
 这67108864足足600多M，太大了，怪不得不会报错，那我们去改改一下它吧，改完重新测试：


 
  
首先在启动mysql的情况下，进入容器内，也可以直接在Docker桌面版直接点Cli图标进入： 
  
 docker exec -it mysql bash



 
  
进入 /etc/mysql 目录，去修改my.cnf文件： 
  
 cd /etc/mysql



 
  
先按照vim，要不编辑不了文件： 
  
 apt-get update
apt-get install vim



 
  
修改my.cnf 
  
 vim my.cnf



 
  
在最后一行添加max_allowed_packet=20M(按i编辑，编辑完按esc，输入:wq退出) 
  
  
[mysqld]
pid-file= /var/run/mysqld/mysqld.pid
socket= /var/run/mysqld/mysqld.sock
datadir= /var/lib/mysql
secure-file-priv= NULL
# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
 
# Custom config should go here
!includedir /etc/mysql/conf.d/
max_allowed_packet=2M



 
  
退出容器 
  
 # exit



 
  
查看mysql容器id 
  
 docker ps -a



 
  


文章图片 





 
  
重启mysql 
  
 docker restart c178e8998e68



 
 重启成功后查看最大的max_allowed_pactet，发现已经修改成功：


 
 mysql> show VARIABLES like '%max_allowed_packet%';

+---------------------------+------------+
| Variable_name| Value|
+---------------------------+------------+
| max_allowed_packet| 2097152|
| mysqlx_max_allowed_packet | 67108864|
| slave_max_allowed_packet| 1073741824 |
+---------------------------+------------+



 
 我们再次执行拼接sql，发现100w的时候，sql就达到了3.6M左右，超过了我们设置的2M，成功的演示抛出了错误：


 
 org.springframework.dao.TransientDataAccessResourceException: 
### Cause: com.mysql.cj.jdbc.exceptions.PacketTooBigException: Packet for query is too large (36,788,583 > 2,097,152). You can change this value on the server by setting the 'max_allowed_packet' variable.
;
 Packet for query is too large (36,788,583 > 2,097,152). You can change this value on the server by setting the 'max_allowed_packet' variable.;
 nested exception is com.mysql.cj.jdbc.exceptions.PacketTooBigException: Packet for query is too large (36,788,583 > 2,097,152). You can change this value on the server by setting the 'max_allowed_packet' variable.



 
 批量处理为什么这么慢？


 
 但是，仔细一看就会发现，上面的方式，怎么批处理的时候，并没有展示出优势了，和for循环没有什么区别？这是对的么？


 
 这肯定是不对的，从官方文档中，我们可以看到它会批量更新，不会每次去创建预处理语句，理论是更快的。


 
  


文章图片 





 
 然后我发现我的一个最重要的问题：数据库连接 URL 地址少了rewriteBatchedStatements=true


 
 如果我们不写，MySQL JDBC 驱动在默认情况下会忽视 executeBatch() 语句，我们期望批量执行的一组 sql 语句拆散，但是执行的时候是一条一条地发给 MySQL 数据库，实际上是单条插入，直接造成较低的性能。我说怎么性能和循环去插入数据差不多。


 
 只有将 rewriteBatchedStatements 参数置为 true, 数据库驱动才会帮我们批量执行 SQL。


 
 正确的数据库连接：


 
 jdbc:mysql://127.0.0.1:3306/test?characterEncoding=utf-8&useSSL=false&allowPublicKeyRetrieval=true&&serverTimezone=UTC&setUnicode=true&characterEncoding=utf8&&nullCatalogMeansCurrent=true&&autoReconnect=true&&allowMultiQueries=true&&&rewriteBatchedStatements=true



 
 找到问题之后，我们重新测试批量测试,最终的结果如下：


 
  
 
 
插入方式 
10 
100 
1000 
1w 
10w 
100w 
1000w 
 
 
 
 
for循环插入 
387 
1150 
7907 
70026 
635984 
太久了... 
太久了... 
 
 
拼接sql插入 
308 
320 
392 
838 
3156 
24948（很可能超过sql长度限制） 
OutOfMemoryError: 堆内存溢出 
 
 
批处理(重点) 
333 
323 
362 
636 
1638 
8978 
OutOfMemoryError: 堆内存溢出 
 
 
批处理 + 分批提交 
359 
313 
394 
630 
2907 
18631 
OutOfMemoryError: 堆内存溢出 
 
 
  
 从上面的结果来看，确实批处理是要快很多的，当数量级太大的时候，其实都会超过内存溢出的，批处理加上分批提交并没有变快，和批处理差不多，反而变慢了，提交太多次了，拼接sql的方案在数量比较少的时候其实和批处理相差不大，最差的方案就是for循环插入数据，这真的特别的耗时。100条的时候就已经需要1s了，不能选择这种方案。


 
 一开始发现批处理比较慢的时候，真的挺怀疑自己，后面发现是有一个参数，有一种拨开云雾的感觉，知道得越多，不知道的越多。


 
 【作者简介】： 
秦怀，公众号【秦怀杂货店】作者，技术之路不在一时，山高水长，纵使缓慢，驰而不息。


 
 剑指Offer全部题解PDF


 
 2020年我写了什么？


 
 开源编程笔记



		  	

    
    




    
    
    


推荐阅读

           
                  
              
                  刘德华刷屏热搜，我只觉得悲哀！ 
                
                   
                
              
            

                  
              
                  招商银行app转账记录怎么删除 
                
                   
                
              
            

                  
              
                  吐司可以怎么吃 夏天吐司要放冰箱冷藏吗 
                
                   
                
              
            

                  
              
                  壁挂炉关掉暖气只留热水怎么操作,这是非常重要的指数 
                
                   
                
              
            

                  
              
                  如何清理笔记本电脑灰尘 怎么清理笔记本电脑灰尘 
                
                   
                
              
            

                  
              
                  手工消防车怎么做 
                
                   
                
              
            

                  
              
                  恭贺新春|恭贺新春 | 汉字到底有多少字（） 
                
                   
                
              
            

                  
              
                  环保板材有哪些等级 
                
                   
                
              
            

                  
              
                  原车漆可以保持几年 原车漆可以保持几年不变色 
                
                   
                
              
            

                  
              
                  迷你世界秋果激活码 迷你世界秋果兑换码 
                
                   
                
              
            

                  
              
                  女人越贵,越有底气,你们赞同吗？ 
                
                   
                
              
            

                  
              
                  windows查看本机端口 我来分享win8系统查看本机端口的基础操作 
                
                   
                
              
            

                  
              
                  新生儿黄疸多久消退 
                
                   
                
              
            

                  
              
                  北极熊为何不吃企鹅 北极熊不吃企鹅 
                
                   
                
              
            

                  
              
                  比熊养殖技术 比熊养殖技巧 
                
                   
                
              
            

                  
              
                  门店财务分析,杜邦财务分析 
                
                   
                
              
            

                  
              
                  原神什么时候升暴击 原神暴击提升时机分析 
                
                   
                
              
            

                  
              
                  武装突袭3怎么在地图上看自己 武装突袭怎么看自己位置 
                
                   
                
              
            

                  
              
                  2023海南热带野生动植物园赏花时间 海南热带野生动植物园本地人门票 
                
                   
                
              
            

                  
              
                  万寿果泡酒的功效与作用有哪些 
                
                   
                
              
            

          

Docker应用:容器间通信与Mariadb数据库主从复制 
 数据库设计与优化 
 数据库总结语句 
 MySql数据库备份与恢复 
 数据库|SQL行转列方式优化查询性能实践 
 MySQL数据库的基本操作 
 springboot整合数据库连接池-->druid 
 Android|Android sqlite3数据库入门系列 
 Python3|Python3 MySQL 数据库连接 
 达梦数据库|DM8表空间备份恢复

数据库批量插入这么讲究的么（）

推荐阅读

刘德华刷屏热搜，我只觉得悲哀！

招商银行app转账记录怎么删除

吐司可以怎么吃夏天吐司要放冰箱冷藏吗

壁挂炉关掉暖气只留热水怎么操作,这是非常重要的指数

如何清理笔记本电脑灰尘怎么清理笔记本电脑灰尘

手工消防车怎么做

恭贺新春|恭贺新春 | 汉字到底有多少字（）

环保板材有哪些等级

原车漆可以保持几年原车漆可以保持几年不变色

迷你世界秋果激活码迷你世界秋果兑换码

女人越贵,越有底气,你们赞同吗？

windows查看本机端口我来分享win8系统查看本机端口的基础操作

新生儿黄疸多久消退

北极熊为何不吃企鹅北极熊不吃企鹅

比熊养殖技术比熊养殖技巧

门店财务分析,杜邦财务分析

原神什么时候升暴击原神暴击提升时机分析

武装突袭3怎么在地图上看自己武装突袭怎么看自己位置

2023海南热带野生动植物园赏花时间海南热带野生动植物园本地人门票

万寿果泡酒的功效与作用有哪些

插入方式	10	100	1000	1w	10w	100w	1000w
for循环插入	387	1150	7907	70026	635984	太久了...	太久了...
拼接sql插入	308	320	392	838	3156	24948	OutOfMemoryError: 堆内存溢出
批处理	392	917	5442	51647	470666	太久了...	太久了...
批处理 + 分批提交	359	893	5275	50270	472462	太久了...	太久了...