大家好,我是小林,又到了愉快的周末,我來水一水。

上周有位讀者面美團(tuán)時(shí),被問到:TCP 四次揮手中,能不能把第二次的 ACK 報(bào)文, 放到第三次 FIN 報(bào)文一起發(fā)送?

雖然我們?cè)趯W(xué)習(xí) TCP 揮手時(shí),學(xué)到的是需要四次來完成 TCP 揮手,但是在一些情況下, TCP 四次揮手是可以變成 TCP 三次揮手的。


(資料圖片僅供參考)

而且在用 wireshark 工具抓包的時(shí)候,我們也會(huì)常看到 TCP 揮手過程是三次,而不是四次,如下圖:

先來回答為什么 RFC 文檔里定義 TCP 揮手過程是要四次?

再來回答什么情況下,什么情況會(huì)出現(xiàn)三次揮手?

為什么 TCP 揮手需要四次?

TCP 四次揮手的過程如下:

具體過程:

客戶端主動(dòng)調(diào)用關(guān)閉連接的函數(shù),于是就會(huì)發(fā)送 FIN 報(bào)文,這個(gè) FIN 報(bào)文代表客戶端不會(huì)再發(fā)送數(shù)據(jù)了,進(jìn)入 FIN_WAIT_1 狀態(tài);服務(wù)端收到了 FIN 報(bào)文,然后馬上回復(fù)一個(gè) ACK 確認(rèn)報(bào)文,此時(shí)服務(wù)端進(jìn)入 CLOSE_WAIT 狀態(tài)。在收到 FIN 報(bào)文的時(shí)候,TCP 協(xié)議棧會(huì)為 FIN 包插入一個(gè)文件結(jié)束符 EOF 到接收緩沖區(qū)中,服務(wù)端應(yīng)用程序可以通過 read 調(diào)用來感知這個(gè) FIN 包,這個(gè) EOF 會(huì)被放在已排隊(duì)等候的其他已接收的數(shù)據(jù)之后,所以必須要得繼續(xù) read 接收緩沖區(qū)已接收的數(shù)據(jù);接著,當(dāng)服務(wù)端在 read 數(shù)據(jù)的時(shí)候,最后自然就會(huì)讀到 EOF,接著read() 就會(huì)返回 0,這時(shí)服務(wù)端應(yīng)用程序如果有數(shù)據(jù)要發(fā)送的話,就發(fā)完數(shù)據(jù)后才調(diào)用關(guān)閉連接的函數(shù),如果服務(wù)端應(yīng)用程序沒有數(shù)據(jù)要發(fā)送的話,可以直接調(diào)用關(guān)閉連接的函數(shù),這時(shí)服務(wù)端就會(huì)發(fā)一個(gè) FIN 包,這個(gè) FIN 報(bào)文代表服務(wù)端不會(huì)再發(fā)送數(shù)據(jù)了,之后處于 LAST_ACK 狀態(tài);客戶端接收到服務(wù)端的 FIN 包,并發(fā)送 ACK 確認(rèn)包給服務(wù)端,此時(shí)客戶端將進(jìn)入 TIME_WAIT 狀態(tài);服務(wù)端收到 ACK 確認(rèn)包后,就進(jìn)入了最后的 CLOSE 狀態(tài);客戶端經(jīng)過 2MSL 時(shí)間之后,也進(jìn)入 CLOSE 狀態(tài);

你可以看到,每個(gè)方向都需要一個(gè) FIN 和一個(gè) ACK,因此通常被稱為四次揮手。

為什么 TCP 揮手需要四次呢?

服務(wù)器收到客戶端的 FIN 報(bào)文時(shí),內(nèi)核會(huì)馬上回一個(gè) ACK 應(yīng)答報(bào)文,但是服務(wù)端應(yīng)用程序可能還有數(shù)據(jù)要發(fā)送,所以并不能馬上發(fā)送 FIN 報(bào)文,而是將發(fā)送 FIN 報(bào)文的控制權(quán)交給服務(wù)端應(yīng)用程序:

如果服務(wù)端應(yīng)用程序有數(shù)據(jù)要發(fā)送的話,就發(fā)完數(shù)據(jù)后,才調(diào)用關(guān)閉連接的函數(shù);

如果服務(wù)端應(yīng)用程序沒有數(shù)據(jù)要發(fā)送的話,可以直接調(diào)用關(guān)閉連接的函數(shù),

從上面過程可知,是否要發(fā)送第三次揮手的控制權(quán)不在內(nèi)核,而是在被動(dòng)關(guān)閉方(上圖的服務(wù)端)的應(yīng)用程序,因?yàn)閼?yīng)用程序可能還有數(shù)據(jù)要發(fā)送,由應(yīng)用程序決定什么時(shí)候調(diào)用關(guān)閉連接的函數(shù),當(dāng)調(diào)用了關(guān)閉連接的函數(shù),內(nèi)核就會(huì)發(fā)送 FIN 報(bào)文了,所以服務(wù)端的 ACK 和 FIN 一般都會(huì)分開發(fā)送。

FIN 報(bào)文一定得調(diào)用關(guān)閉連接的函數(shù),才會(huì)發(fā)送嗎?

不一定。

如果進(jìn)程退出了,不管是不是正常退出,還是異常退出(如進(jìn)程崩潰),內(nèi)核都會(huì)發(fā)送 FIN 報(bào)文,與對(duì)方完成四次揮手。

粗暴關(guān)閉 vs 優(yōu)雅關(guān)閉

前面介紹 TCP 四次揮手的時(shí)候,并沒有詳細(xì)介紹關(guān)閉連接的函數(shù),其實(shí)關(guān)閉的連接的函數(shù)有兩種函數(shù):

close 函數(shù),同時(shí) socket 關(guān)閉發(fā)送方向和讀取方向,也就是 socket 不再有發(fā)送和接收數(shù)據(jù)的能力;shutdown 函數(shù),可以指定 socket 只關(guān)閉發(fā)送方向而不關(guān)閉讀取方向,也就是 socket 不再有發(fā)送數(shù)據(jù)的能力,但是還是具有接收數(shù)據(jù)的能力;

如果客戶端是用 close 函數(shù)來關(guān)閉連接,那么在 TCP 四次揮手過程中,如果收到了服務(wù)端發(fā)送的數(shù)據(jù),由于客戶端已經(jīng)不再具有發(fā)送和接收數(shù)據(jù)的能力,所以客戶端的內(nèi)核會(huì)回 RST 報(bào)文給服務(wù)端,然后內(nèi)核會(huì)釋放連接,這時(shí)就不會(huì)經(jīng)歷完成的 TCP 四次揮手,所以我們常說,調(diào)用 close 是粗暴的關(guān)閉。

當(dāng)服務(wù)端收到 RST 后,內(nèi)核就會(huì)釋放連接,當(dāng)服務(wù)端應(yīng)用程序再次發(fā)起讀操作或者寫操作時(shí),就能感知到連接已經(jīng)被釋放了:

如果是讀操作,則會(huì)返回 RST 的報(bào)錯(cuò),也就是我們常見的Connection reset by peer。如果是寫操作,那么程序會(huì)產(chǎn)生 SIGPIPE 信號(hào),應(yīng)用層代碼可以捕獲并處理信號(hào),如果不處理,則默認(rèn)情況下進(jìn)程會(huì)終止,異常退出。

相對(duì)的,shutdown 函數(shù)因?yàn)榭梢灾付ㄖ魂P(guān)閉發(fā)送方向而不關(guān)閉讀取方向,所以即使在 TCP 四次揮手過程中,如果收到了服務(wù)端發(fā)送的數(shù)據(jù),客戶端也是可以正常讀取到該數(shù)據(jù)的,然后就會(huì)經(jīng)歷完整的 TCP 四次揮手,所以我們常說,調(diào)用 shutdown 是優(yōu)雅的關(guān)閉。

但是注意,shutdown 函數(shù)也可以指定「只關(guān)閉讀取方向,而不關(guān)閉發(fā)送方向」,但是這時(shí)候內(nèi)核是不會(huì)發(fā)送 FIN 報(bào)文的,因?yàn)榘l(fā)送 FIN 報(bào)文是意味著我方將不再發(fā)送任何數(shù)據(jù),而shutdown 如果指定「不關(guān)閉發(fā)送方向」,就意味著 socket 還有發(fā)送數(shù)據(jù)的能力,所以內(nèi)核就不會(huì)發(fā)送 FIN。

什么情況會(huì)出現(xiàn)三次揮手?

當(dāng)被動(dòng)關(guān)閉方(上圖的服務(wù)端)在 TCP 揮手過程中,「沒有數(shù)據(jù)要發(fā)送」并且「開啟了 TCP 延遲確認(rèn)機(jī)制」,那么第二和第三次揮手就會(huì)合并傳輸,這樣就出現(xiàn)了三次揮手。

然后因?yàn)?TCP 延遲確認(rèn)機(jī)制是默認(rèn)開啟的,所以導(dǎo)致我們抓包時(shí),看見三次揮手的次數(shù)比四次揮手還多。

什么是 TCP 延遲確認(rèn)機(jī)制?

當(dāng)發(fā)送沒有攜帶數(shù)據(jù)的 ACK,它的網(wǎng)絡(luò)效率也是很低的,因?yàn)樗灿?40 個(gè)字節(jié)的 IP 頭 和 TCP 頭,但卻沒有攜帶數(shù)據(jù)報(bào)文。

為了解決 ACK 傳輸效率低問題,所以就衍生出了TCP 延遲確認(rèn)。

TCP 延遲確認(rèn)的策略:

當(dāng)有響應(yīng)數(shù)據(jù)要發(fā)送時(shí),ACK 會(huì)隨著響應(yīng)數(shù)據(jù)一起立刻發(fā)送給對(duì)方當(dāng)沒有響應(yīng)數(shù)據(jù)要發(fā)送時(shí),ACK 將會(huì)延遲一段時(shí)間,以等待是否有響應(yīng)數(shù)據(jù)可以一起發(fā)送如果在延遲等待發(fā)送 ACK 期間,對(duì)方的第二個(gè)數(shù)據(jù)報(bào)文又到達(dá)了,這時(shí)就會(huì)立刻發(fā)送 ACK

延遲等待的時(shí)間是在 Linux 內(nèi)核中定義的,如下圖:

關(guān)鍵就需要 HZ 這個(gè)數(shù)值大小,HZ 是跟系統(tǒng)的時(shí)鐘頻率有關(guān),每個(gè)操作系統(tǒng)都不一樣,在我的 Linux 系統(tǒng)中 HZ 大小是 1000,如下圖:

知道了 HZ 的大小,那么就可以算出:

最大延遲確認(rèn)時(shí)間是 200 ms (1000/5)最短延遲確認(rèn)時(shí)間是 40 ms (1000/25)怎么關(guān)閉 TCP 延遲確認(rèn)機(jī)制?

如果要關(guān)閉 TCP 延遲確認(rèn)機(jī)制,可以在 Socket 設(shè)置里啟用 TCP_QUICKACK,啟用TCP_QUICKACK,就相當(dāng)于關(guān)閉 TCP 延遲確認(rèn)機(jī)制。

// 1 表示開啟 TCP_QUICKACK,即關(guān)閉 TCP 延遲確認(rèn)機(jī)制int value = 1;setsockopt(socketfd, IPPROTO_TCP, TCP_QUICKACK, (char*)& value, sizeof(int));實(shí)驗(yàn)驗(yàn)證

實(shí)驗(yàn)一

接下來,來給大家做個(gè)實(shí)驗(yàn),驗(yàn)證這個(gè)結(jié)論:

當(dāng)被動(dòng)關(guān)閉方(上圖的服務(wù)端)在 TCP 揮手過程中,「沒有數(shù)據(jù)要發(fā)送」并且「開啟了 TCP 延遲確認(rèn)機(jī)制」,那么第二和第三次揮手就會(huì)合并傳輸,這樣就出現(xiàn)了三次揮手。

服務(wù)端的代碼如下,做的事情很簡單,就讀取數(shù)據(jù),然后當(dāng) read 返回 0 的時(shí)候,就馬上調(diào)用 close 關(guān)閉連接。因?yàn)?TCP 延遲確認(rèn)機(jī)制是默認(rèn)開啟的,所以不需要特殊設(shè)置。

#include #include #include #include #include #include #include #include #include #define MAXLINE 1024int main(int argc, char *argv[]){ // 1. 創(chuàng)建一個(gè)監(jiān)聽 socket int listenfd = socket(AF_INET, SOCK_STREAM, 0); if(listenfd < 0) { fprintf(stderr, "socket error : %s\n", strerror(errno)); return -1; } // 2. 初始化服務(wù)器地址和端口 struct sockaddr_in server_addr; bzero(&server_addr, sizeof(struct sockaddr_in)); server_addr.sin_family = AF_INET; server_addr.sin_addr.s_addr = htonl(INADDR_ANY); server_addr.sin_port = htons(8888); // 3. 綁定地址+端口 if(bind(listenfd, (struct sockaddr *)(&server_addr), sizeof(struct sockaddr)) < 0) { fprintf(stderr,"bind error:%s\n", strerror(errno)); return -1; } printf("begin listen....\n"); // 4. 開始監(jiān)聽 if(listen(listenfd, 128)) { fprintf(stderr, "listen error:%s\n\a", strerror(errno)); exit(1); } // 5. 獲取已連接的socket struct sockaddr_in client_addr; socklen_t client_addrlen = sizeof(client_addr); int clientfd = accept(listenfd, (struct sockaddr *)&client_addr, &client_addrlen); if(clientfd < 0) { fprintf(stderr, "accept error:%s\n\a", strerror(errno)); exit(1); } printf("accept success\n"); char message[MAXLINE] = {0}; while(1) { //6. 讀取客戶端發(fā)送的數(shù)據(jù) int n = read(clientfd, message, MAXLINE); if(n < 0) { // 讀取錯(cuò)誤 fprintf(stderr, "read error:%s\n\a", strerror(errno)); break; } else if(n == 0) { // 返回 0 ,代表讀到 FIN 報(bào)文 fprintf(stderr, "client closed \n"); close(clientfd); // 沒有數(shù)據(jù)要發(fā)送,立馬關(guān)閉連接 break; } message[n] = 0; printf("received %d bytes: %s\n", n, message); } close(listenfd); return 0;}

客戶端代碼如下,做的事情也很簡單,與服務(wù)端連接成功后,就發(fā)送數(shù)據(jù)給服務(wù)端,然后睡眠一秒后,就調(diào)用 close 關(guān)閉連接,所以客戶端是主動(dòng)關(guān)閉方:

#include #include #include #include #include #include #include #include int main(int argc, char *argv[]){ // 1. 創(chuàng)建一個(gè)監(jiān)聽 socket int connectfd = socket(AF_INET, SOCK_STREAM, 0); if(connectfd < 0) { fprintf(stderr, "socket error : %s\n", strerror(errno)); return -1; } // 2. 初始化服務(wù)器地址和端口 struct sockaddr_in server_addr; bzero(&server_addr, sizeof(struct sockaddr_in)); server_addr.sin_family = AF_INET; server_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); server_addr.sin_port = htons(8888); // 3. 連接服務(wù)器 if(connect(connectfd, (struct sockaddr *)(&server_addr), sizeof(server_addr)) < 0) { fprintf(stderr,"connect error:%s\n", strerror(errno)); return -1; } printf("connect success\n"); char sendline[64] = "hello, i am xiaolin"; //4. 發(fā)送數(shù)據(jù) int ret = send(connectfd, sendline, strlen(sendline), 0); if(ret != strlen(sendline)) { fprintf(stderr,"send data error:%s\n", strerror(errno)); return -1; } printf("already send %d bytes\n", ret); sleep(1); //5. 關(guān)閉連接 close(connectfd); return 0;}

編譯服務(wù)端和客戶端的代碼:

先啟用服務(wù)端:

然后用 tcpdump 工具開始抓包,命令如下:

tcpdump -i lo tcp and port 8888 -s0 -w /home/tcp_close.pcap

然后啟用客戶端,可以看到,與服務(wù)端連接成功后,發(fā)完數(shù)據(jù)就退出了。

此時(shí),服務(wù)端的輸出:

接下來,我們來看看抓包的結(jié)果。

可以看到,TCP 揮手次數(shù)是 3 次。

所以,下面這個(gè)結(jié)論是沒問題的。

結(jié)論:當(dāng)被動(dòng)關(guān)閉方(上圖的服務(wù)端)在 TCP 揮手過程中,「沒有數(shù)據(jù)要發(fā)送」并且「開啟了 TCP 延遲確認(rèn)機(jī)制(默認(rèn)會(huì)開啟)」,那么第二和第三次揮手就會(huì)合并傳輸,這樣就出現(xiàn)了三次揮手。

實(shí)驗(yàn)二

我們?cè)僮鲆淮螌?shí)驗(yàn),來看看關(guān)閉 TCP 延遲確認(rèn)機(jī)制,會(huì)出現(xiàn)四次揮手嗎?

客戶端代碼保持不變,服務(wù)端代碼需要增加一點(diǎn)東西。

在上面服務(wù)端代碼中,增加了打開了 TCP_QUICKACK (快速應(yīng)答)機(jī)制的代碼,如下:

編譯好服務(wù)端代碼后,就開始運(yùn)行服務(wù)端和客戶端的代碼,同時(shí)用 tcpdump 進(jìn)行抓包。

抓包的結(jié)果如下,可以看到是四次揮手。

所以,當(dāng)被動(dòng)關(guān)閉方(上圖的服務(wù)端)在 TCP 揮手過程中,「沒有數(shù)據(jù)要發(fā)送」,同時(shí)「關(guān)閉了 TCP 延遲確認(rèn)機(jī)制」,那么就會(huì)是四次揮手。

設(shè)置 TCP_QUICKACK 的代碼,為什么要放在 read 返回 0 之后?

我也是多次實(shí)驗(yàn)才發(fā)現(xiàn),在 bind 之前設(shè)置 TCP_QUICKACK 是不生效的,只有在 read 返回 0 的時(shí)候,設(shè)置 TCP_QUICKACK 才會(huì)出現(xiàn)四次揮手。

網(wǎng)上查了下資料說,設(shè)置 TCP_QUICKACK 并不是永久的,所以每次讀取數(shù)據(jù)的時(shí)候,如果想要立刻回 ACK,那就得在每次讀取數(shù)據(jù)之后,重新設(shè)置 TCP_QUICKACK。

而我這里的實(shí)驗(yàn),目的是為了當(dāng)收到客戶端的 FIN 報(bào)文(第一次揮手)后,立馬回 ACK 報(bào)文,所以就在 read 返回 0 的時(shí)候,設(shè)置 TCP_QUICKACK。

當(dāng)然,實(shí)際應(yīng)用中,沒人會(huì)在我這個(gè)位置設(shè)置 TCP_QUICKACK,因?yàn)椴僮飨到y(tǒng)都通過 TCP 延遲確認(rèn)機(jī)制幫我們把四次揮手優(yōu)化成了三次揮手了,這本來就是一件好事呀。

總結(jié)

當(dāng)被動(dòng)關(guān)閉方在 TCP 揮手過程中,如果「沒有數(shù)據(jù)要發(fā)送」,同時(shí)「沒有開啟 TCP_QUICKACK(默認(rèn)情況就是沒有開啟,沒有開啟 TCP_QUICKACK,等于就是在使用 TCP 延遲確認(rèn)機(jī)制)」,那么第二和第三次揮手就會(huì)合并傳輸,這樣就出現(xiàn)了三次揮手。

標(biāo)簽: