syn重发_TCP/IP（超时，重传，控流，拥塞处理） syn重发

上篇文章关于 TCP/IP 几点总结用通俗方式讲述了TCP/IP几点基本知识。本文将总结TCP/IP 通信过程经常碰见的几个超时情况
1 建连接时SYN超时
假设server端接到了clien发的SYN后回了SYN-ACK后client掉线了，server端没有收到client回来的ACK，那么，这个连接处于一个中间状态，即没成功，也没失败。于是，server端如果在一定时间内没有收到的TCP会重发SYN-ACK。在Linux下，默认重试次数为5次，重试的间隔时间从1s开始每次都翻售，5次的重试时间间隔为1s, 2s, 4s, 8s, 16s，总共31s，第5次发出后还要等32s都知道第5次也超时了，所以，总共需要 1s + 2s + 4s+ 8s+ 16s + 32s = 2^6 -1 = 63s，TCP才会把断开这个连接
2 SYN Flood攻击
凡是有超时的地方就有DDOS攻击的可能。一些恶意的人就为此制造了SYN Flood攻击——给服务器发了一个SYN后，就下线了，于是服务器需要默认等63s才会断开连接，这样，攻击者就可以把服务器的syn连接的队列耗尽，让正常的连接请求不能处理。于是，Linux下给了一个叫tcp_syncookies的参数来应对这个事——当SYN队列满了后，TCP会通过源地址端口、目标地址端口和时间戳打造出一个特别的Sequence Number发回去(又叫cookie)，如果是攻击者则不会有响应，如果是正常连接，则会把这个 SYN Cookie发回来，然后服务端可以通过cookie建连接(即使你不在SYN队列中)。注意，请先千万别用tcp_syncookies来处理正常的大负载的连接的情况。因为，synccookies是妥协版的TCP协议，并不严谨。对于正常的请求，你应该调整三个TCP参数可供你选择，第一个是：tcp_synack_retries可以用他来减少重试次数；第二个是：tcp_max_syn_backlog，可以增大SYN连接数；第三个是：tcp_abort_on_overflow 处理不过来干脆就直接拒绝连接了
3 ISN的初始化
ISN是不能硬编码，不然会出问题的——比如：如果连接建好后始终用1来做ISN，如果client发了30个segment过去，但是网络断了，于是 client重连，又用了1做ISN，但是之前连接的那些包到了，于是就被当成了新连接的包，此时，client的Sequence Number 可能是3，而Server端认为client端的这个号是30了。全乱了。RFC793中说，ISN会和一个假的时钟绑在一起，这个时钟会在每4微秒对ISN做加一操作，直到超过2^32，又从0开始。这样，一个ISN的周期大约是4.55个小时。因为，我们假设我们的TCP Segment在网络上的存活时间不会超过Maximum Segment Lifetime(缩写为MSL)，所以，只要MSL的值小于4.55小时，那么，我们就不会重用到ISN。
4 MSL 和 TIME_WAIT
通过上面的ISN的描述，相信你也知道MSL是怎么来的了。我们注意到，在TCP的状态图中，从TIME_WAIT状态到CLOSED状态，有一个超时设置，这个超时设置是 2*MSL(RFC793定义了MSL为2分钟，Linux设置成了30s)。
为什么要这有TIME_WAIT，为什么不直接给转成CLOSED状态。主要有两个原因：
1)TIME_WAIT确保有足够的时间让对端收到了ACK，如果被动关闭的那方没有收到Ack，就会触发被动端重发Fin，一来一去正好2个MSL，
2)有足够的时间让这个连接不会跟后面的连接混在一起(你要知道，有些自做主张的路由器会缓存IP数据包，如果连接被重用了，那么这些延迟收到的包就有可能会跟新连接混在一起)
5 TIME_WAIT数量太多以及解决方案
从上面的描述我们可以知道，TIME_WAIT是个很重要的状态，但是如果在大并发的短链接下，TIME_WAIT 就会太多，这也会消耗很多系统资源。网上很多教程会教你设置两个参数，一个叫tcp_tw_reuse，另一个叫tcp_tw_recycle的参数，这两个参数默认值都是被关闭的，后者recyle比前者resue更为激进，resue要温柔一些。另外，如果使用tcp_tw_reuse，必需设置tcp_timestamps=1，否则无效。这里，你一定要注意，打开这两个参数会有比较大的坑——可能会让TCP连接出一些诡异的问题(因为如上述一样，如果不等待超时重用连接的话，新的连接可能会建不上。
tcp_tw_reuse：
官方文档上说tcp_tw_reuse 加上tcp_timestamps(又叫PAWS, for Protection Against Wrapped Sequence Numbers)可以保证协议的角度上的安全，但是你需要tcp_timestamps在两边都被打开。
tcp_tw_recycle：
如果是tcp_tw_recycle被打开了话，会假设对端开启了tcp_timestamps，然后会去比较时间戳，如果时间戳变大了，就可以重用。但是，如果对端是一个NAT网络的话(如：一个公司只用一个IP出公网)或是对端的IP被另一台重用了，这个事就复杂了。建链接的SYN可能就被直接丢掉了可能会看到connection time out的错误。
tcp_max_tw_buckets：
这个是控制并发的TIME_WAIT的数量，默认值是180000，如果超限，那么，系统会把多的给destory掉，然后在日志里打一个警告(如：time wait bucket table overflow)，官网文档说这个参数是用来对抗DDoS攻击的。也说的默认值180000并不小。这个还是需要根据实际情况考虑。
使用tcp_tw_reuse和tcp_tw_recycle来解决TIME_WAIT的问题是非常非常危险的，因为这两个参数违反了TCP协议
其实，TIME_WAIT表示的是你主动断连接。如果让对端断连接，那么这个破问题就是对方的了。另外，如果你的服务器是于HTTP服务器，那么设置一个HTTP的KeepAlive有多重要(浏览器会重用一个TCP连接来处理多个HTTP请求)，然后让客户端去断链接。
----------------------------------接下来探讨下可靠性与重传机制--------------------------
1 ACK 携带信息1)期待要收到下一个数据包的编号；
2)接收方的接收窗口的剩余容量。
注意：由于 TCP 通信是双向的，所以双方都需要发送 ACK。两方的窗口大小，很可能是不一样的。而且 ACK 只是很简单的几个字段，通常与数据合并在一个数据包里面发送。
文章图片

上图一共4次通信。第一次通信，A 主机发给B 主机的数据包编号是1，长度是100字节，因此第二次通信 B 主机的 ACK 编号是 1 + 100 = 101，第三次通信 A 主机的数据包编号也是 101。同理，第二次通信 B 主机发给 A 主机的数据包编号是1，长度是200字节，因此第三次通信 A 主机的 ACK 是201，第四次通信 B 主机的数据包编号也是201
2 TCP 协议可以保证数据通信的可靠性，做法如下
每一个数据包都带有下一个数据包的编号。如果下一个数据包没有收到，那么 ACK 的编号就不会发生变化。
接收端给发送端的Ack确认只会确认最后一个连续的包，比如，发送端发了1,2,3,4,5一共五份数据，接收端收到了1，2，于是回ack 3，然后收到了4(注意此时3没收到)，此时的TCP会怎么办？我们要知道，因为正如前面所说的，SeqNum和Ack是以字节数为单位，所以ack的时候，不能跳着确认，只能确认最大的连续收到的包，不然，发送端就以为之前的都收到了。如果发送方发现收到连续的重复 ACK，或者超时了还没有收到任何 ACK，就会确认丢包，从而再次发送这个包。通过重传这种机制，TCP 保证了不会有数据包丢失
3 超时重传机制：
一种是不回ack，死等3，当发送方发现收不到3的ack超时后，会重传3。一旦接收方收到3后，会ack 回 4——意味着3和4都收到了。
但是，这种方式会有比较严重的问题，那就是因为要死等3，所以会导致4和5即便已经收到了，而发送方也完全不知道发生了什么事，因为没有收到Ack，所以，发送方可能会悲观地认为也丢了，所以有可能也会导致4和5的重传。
对此有两种选择：1 )仅重传timeout的包。也就是第3份数据。
2) 重传timeout后所有的数据，也就是第3，4，5这三份数据。
第一种会节省带宽，但是慢，第二种会快一点，但是会浪费带宽，也可能会有无用功。但总体来说都不好。因为都在等timeout，timeout可能会很长，针对两种情况TCP/IP 协议给了三种算法供选择：Fast Retransmit，Selective Acknowledgment，Duplicate SACK。后续可针对此类算法进行展开详解
4 超时重传中的超时TIMEOUT设置问题
针对上述情况得知合理的设置timeout时间长度对重传很重要
1)设长了，重发就慢，丢了老半天才重发，没有效率，性能差；
2)设短了，会导致可能并没有丢就重发。于是重发的就快，会增加网络拥塞，导致更多的超时，更多的超时导致更多的重发。
这个超时时间在不同的网络的情况下，不是设置一个固定值。只能动态地设置。为了动态地设置，TCP引入了RTT——Round Trip Time，也就是一个数据包从发出去到回来的时间。这样发送端就大约知道需要多少的时间，从而可以方便地设置Timeout——RTO(Retransmission TimeOut)，以让我们的重传机制更高效。听起来似乎很简单，好像就是在发送端发包时记下t0，然后接收端再把这个ack回来时再记一个t1，于是RTT = t1 – t0。没那么简单，这只是一个采样，不能代表普遍情况。TCP/IP 给出的RTT算法：Karn / Partridge 算法， Jacobson / Karels 算法。后续可针对此类算法进行展开详解
------------------------------TCP控流讨论--------------------------------------------
TCP必需要解决的可靠传输以及包乱序(reordering)的问题，所以，TCP必需要知道网络实际的数据处理带宽或是数据处理速度，这样才不会引起网络拥塞，导致丢包。
TCP引入了一些技术和设计来做网络流控，Sliding Window是其中一个技术。前面我们说过，TCP头里有一个字段叫Window，又叫Advertised-Window，这个字段是接收端告诉发送端自己还有多少缓冲区可以接收数据。于是发送端就可以根据这个接收端的处理能力来发送数据，而不会导致接收端处理不过来。接收端在给发送端回ACK中会汇报自己的可用窗口大小，而发送方会根据这个窗口来控制发送数据的大小，以保证接收方可以处理。
问题1)Window变成0了，TCP处理方式如下：
发送端在窗口变成0后，会发ZWP的包给接收方，让接收方来ack他的Window尺寸，一般这个值会设置成3次，第次大约30-60秒(不同的实现可能会不一样)。如果3次过后还是0的话，有的TCP实现就会发RST把链接断了。
注意：只要有等待的地方都可能出现DDoS攻击，Zero Window也不例外，一些攻击者会在和HTTP建好链发完GET请求后，就把Window设置为0，然后服务端就只能等待进行ZWP，于是攻击者会并发大量的这样的请求，把服务器端的资源耗尽
问题2)当对方Window 越来越小，接收方处理方式如下：
如果接收方处理速度越来越慢，就导致接收方可用窗口越来越小。到最后，如果接收方腾出几个字节并告诉发送方现在有几个字节的window，发送方会义无反顾地发送这几个字节，本来一次通信可以传输很大块字节，现在只能几个字节，这就造成资源浪费。要解决这个问题也不难，就是避免对小的window size做出响应，直到有足够大的window size再响应，这个思路可以同时实现在sender和receiver两端：如果这个问题是由Receiver端引起的，那么就会使用 David D Clark’s 方案。在receiver端，如果收到的数据导致window size小于某个值，可以直接ack(0)回sender，这样就把window给关闭了，也阻止了sender再发数据过来，等到receiver端处理了一些数据后windows size 大于等于了MSS，或者，receiver buffer有一半为空，就可以把window打开让send 发送数据过来。
如果这个问题是由Sender端引起的，那么就会使用著名的 Nagle’s algorithm。这个算法的思路也是延时处理，他有两个主要的条件：1)要等到 Window Size>=MSS 或是 Data Size >=MSS，2)收到之前发送数据的ack回包，他才会发数据，否则就是在攒数据。
--------------------------TCP拥塞处理-------------------------------------------------
TCP通过Sliding Window来做流控(Flow Control)，但是TCP觉得这还不够，因为Sliding Window需要依赖于连接的发送端和接收端，其并不知道网络中间发生了什么。TCP的设计者觉得，TCP协议仅仅做到流控并不够，因为流控只是网络模型4层以上的事，TCP的还应该更聪明地知道整个网络上的事。
具体一点，我们知道TCP通过一个timer采样了RTT并计算RTO，但是，如果网络上的延时突然增加，那么，TCP对这个事做出的应对只有重传数据，但是，重传会导致网络的负担更重，于是会导致更大的延迟以及更多的丢包，于是，这个情况就会进入恶性循环被不断地放大。试想一下，如果一个网络内有成千上万的TCP连接都这么行事，那么马上就会形成“网络风暴”，TCP这个协议就会拖垮整个网络。这是一个灾难。
所以，TCP不能忽略网络上发生的事情，而无脑地一个劲地重发数据，对网络造成更大的伤害。对此TCP的设计理念是：TCP不是一个自私的协议，当拥塞发生的时候，要做自我牺牲。就像交通阻塞一样，每个车都应该把路让出来，而不要再去抢路了
拥塞控制主要是四个算法：1)慢启动；
2)拥塞避免；
3)拥塞发生；
4)快速恢复。
【syn重发_TCP/IP（超时，重传，控流，拥塞处理）】后续可针对此算法进行展开

syn重发_TCP/IP（超时，重传，控流，拥塞处理）

推荐阅读

如何科学坐月子春季坐月子这6件事千万别做

广汽本田广汽本田皓影三大件是进口的吗

小森生活抗寒衣服怎么做小森生活抗寒套装制作攻略

冬枣泡了糖精水的怎么看

怎么用炉甘石治荨麻疹

警察是否有权上门抓狗

伊利鲜奶好还是蒙牛纯牛奶好带你了解伊利纯牛奶和蒙牛纯牛奶有什么区别

正常胸和下垂胸对比如何揉胸才能变大

ps快速替换靠山颜色

夏天发面要几个小时才会发的好夏天发面是用冷水还是用温水

圆点|每日好价：大牌小圆点机械键盘开售颜值超高

臀部|臀部引发各种疼痛，令人很苦恼，这些锻炼方法，您会吗？尝试看一看

接触区域按接触还是挤压强度分析

NLP教程（Python NLTK用法示例和完整指南）

三国志战略版震慑状态是什么九大震慑类战法使用攻略

如何为企业选择合适的云服务器？企业要用云服务器怎么搞

lol2018战斗之夜奖励重随在哪领取战斗之夜奖励重随领取地址

果树环剥的方法及作用果树环剥注意事项

考研什么时候出成绩考研是什么

瓜蒌皮的功效与作用及禁忌

syn重发_TCP/IP（ 超时，重传，控流，拥塞处理）

推荐阅读

syn重发_TCP/IP（超时，重传，控流，拥塞处理）