Mysql主从延迟过高导致的case Java

【Mysql主从延迟过高导致的case】昨天同事遇到了一个线上case，主要现象是部分用户下单成功，但是却查不到订单详情信息，追踪到订单表里，发现部分订单并没有更新状态。
排查：
用户下单的后台服务逻辑最近并未做改动，分析报警日志发现，在下午四点到五点之间有部分空指针异常，定位到代码如下：

文章图片

显然这里查询到的订单DTO为空，造成了空指针异常。正常的下单逻辑是，用户创建订单-在本地db生成订单-调用订单中心rpc接口-订单中心创建订单成功返回订单信息-拿到信息后先查本地订单表，然后更新。那么问题来了，从本地表生成订单到订单中心返回信息延迟不过几十ms，是什么原因导致在mysql表中插入成功一条数据，然后在几十ms后查不到该条数据呢？
这里我们很显然的会想到mysql的主从分离，然后我去查看了一下相应db的信息，采用了一主一从，insert或者update操作一般默认走主库，而查询操作一般默认走从库。也就是说，在大约50ms的时间内主库的信息并未同步到从库中。
我们知道，一般来说一级主从延迟大约在50~100us左右，然后我们查看了mysql集群的监控，发现在故障发生期间，集群tps较大，mysql的主从延迟峰值达到130s。

文章图片

文章图片

由于mysql的主从同步机制是异步单线程，当在主机器执行大量写操作时，主从同步的IO线程来不及处理，会导致从机器的同步产生延迟。而目前我们数据库集群的同步机制是以集群为粒度，这会导致同一个集群的一个数据库出现Delay,其他的数据库也受到对应的影响。也就是说故障期间有同事在针对同一个集群中另一个库进行大量的sql操作，tps高达5000以上，而该集群建议的tps在3000以内，导致了主库的访问量太大，而从库的数据同步跟不上，导致从库的数据存在不一致的情况。
存在的问题：
（1）最初采用比较少量的数据进行同步，后续逐渐加大数据量，在加大数据量的过程中只关注了对服务提供方的压力，忽略了对DB的压力
（2）对于入库后在短时间内需要再次查询该条数据的业务，建议查询sql强制走主库，这样就不会存在主从延迟的问题了。

Mysql主从延迟过高导致的case

推荐阅读

金庸为什么写尹志平这一段呢金庸和徐志摩

测试需求的分析

父亲节600字作文5篇父亲节优秀作文500字

wherever怎么读 wherever英文解释

成都市第二十四幼儿园收费多少2023 成都市第二十四幼儿园收费多少2023年度

退税每年退还是今年退退税是否每年都退

冠心病|冠心病病人遇到感冒发烧怎么办？两种药能一起吃吗？医生这样说

支付宝记账本在哪里支付宝怎么记账

光遇好友链接怎么用光遇如何好友链接

诗词学习笔记

活力点的舞蹈名字

电子保单打印下来算原件吗

演示机型:Iphone 13 折叠置顶聊天怎么打开

蓝鲸秀色直播怎么样？蓝鲸秀色直播详情介绍

win7怎么看哪个盘是固态硬盘

汽车升窗器哪个品牌好？推荐几款性价比高的升窗器

小二寸照片的尺寸是多少像素

三菱轻工空调显示14解决方法,是出现什么问题了呢？

轮胎时间和出厂日期怎么看新车轮胎生产日期不一样正常吗

向国旗敬礼主题演讲稿