Linux下TCP非阻塞连接的方法

一、背景 TCP连接函数用于连接服务器端口,若服务器地址不存在时,并不能在短时间内返回连接结果;
二、相关知识 1、连接超时机制
在非阻塞的socket下,调用connect连接函数会一直阻塞到连接建立或者连接失败,连接建立的时候那时间比较快,而失败的时候分错误情况如连接超时ETIMEOUT将为75秒到几分钟的时间。
2、非阻塞socket
非阻塞socket在调用后立刻返回结果,不会阻塞当前线程,并能够从当前结果结合 errno 进行判断执行的情况;
非阻塞socket一般配合I/O复用模型(epoll、select)去监控、处理多个I/O;
三、实现 主要步骤:
1、临时设置socket属性为非阻塞;
2、进行connect函数调用;
【Linux下TCP非阻塞连接的方法】3、通过select检测socket是否可写;
4、处理异常,恢复socket原属性;
主入口,输入地址、端口、超时时间,输出socket句柄值:

int api_tcp_connect_setup_nonblock(u32 u32ip, u16 u16port, int *pdst_fd, int timeout_sec) { struct sockaddr_in dst_addr = {0}; struct sockaddr_in lcl_addr = {0}; memset(&dst_addr, 0, sizeof(struct sockaddr_in)); memset(&lcl_addr, 0, sizeof(struct sockaddr_in)); dst_addr.sin_family = AF_INET; dst_addr.sin_addr.s_addr = u32ip; dst_addr.sin_port = u16port; lcl_addr.sin_family = AF_INET; lcl_addr.sin_addr.s_addr = 0; lcl_addr.sin_port = 0; return __connect_setup_nonblock_b(lcl_addr, dst_addr, pdst_fd, timeout_sec); }

二层嵌套,这个主要就是根据输入的本地绑定的地址lcl_addr(可选)、连接的目的地址dst_addr去完成连接;
static int __connect_setup_nonblock_b(struct sockaddr_in lcl_addr, struct sockaddr_in dst_addr, int *pdst_fd, int timeout_sec) { int ret= FAILURE; /* socket options */ int old_option = 0; int new_option = 0; int reuse = 1; /* select */ fd_set writefds; struct timeval timeout; /* reset socket error */ int error = 0; socklen_t elen = sizeof(error); if ( !pdst_fd ) { LOGW("input err\n"); goto _E1; }*pdst_fd = socket(AF_INET, SOCK_STREAM, 0); if ( *pdst_fd == FAILURE ) { LOGE("socket\n"); goto _E1; } ret = setsockopt(*pdst_fd, SOL_SOCKET, SO_REUSEADDR, (const char*)&reuse, sizeof(reuse)); if ( ret != SUCCESS ) { LOGE("Setsockopt() SO_REUSEADDR failed \n"); goto _E2; } ret = bind(*pdst_fd, (struct sockaddr *)&lcl_addr, sizeof(struct sockaddr_in)); if ( ret != SUCCESS ) { LOGE("Bind fail\n"); goto _E2; }/* Set nonblocking */ old_option = fcntl(*pdst_fd, F_GETFL); new_option = old_option | O_NONBLOCK; fcntl(*pdst_fd, F_SETFL, new_option); ret = connect(*pdst_fd, (struct sockaddr*)&dst_addr, sizeof(struct sockaddr_in)); if ( ret == 0 ) { fcntl(*pdst_fd, F_SETFL, old_option); LOGD("connect success immediately\n"); goto _S0; } else if ( errno != EINPROGRESS ) { /* Connect error */ LOGE("connect\n"); goto _E2; }FD_ZERO(&writefds); FD_SET(*pdst_fd, &writefds); timeout.tv_sec= timeout_sec; timeout.tv_usec = 0; ret = select(*pdst_fd + 1, NULL, &writefds, NULL, &timeout); if ( ret <= 0 ) { /* timeout or error */ LOGE("timeout or error\n"); goto _E2; } if ( !FD_ISSET(*pdst_fd, &writefds) ) { /* Not socketfd found */ LOGE("Not socketfd found\n"); goto _E2; } ret = getsockopt(*pdst_fd, SOL_SOCKET, SO_ERROR, (char *)&error, &elen); if ( ret < 0 ) { LOGE("getsockopt error\n"); goto _E2; } if ( error != 0 ) { /* Connect failed after select */ LOGW("Connect failed after select with the error: %d %s\n", error, strerror(error)); goto _E2; }

LOGD("connect success after select\n"); /* Connect success, set to old fnctl option */ fcntl(*pdst_fd, F_SETFL, old_option); goto _S0; _E2: CLOSE_SOCK(*pdst_fd); _E1: return FAILURE; _S0: return SUCCESS; }

需要注意的就是 connect 之后的 select 处理去判断连接是否成功; select 返回 0,表示连接超时;
select 返回1,检测连接是否可写,
若套接字不可写则是有异常;
若套接字可写则还得使用 SO_ERROR 看看套接字上是否存在有待处理的错误如 ECONNREFUSED、ETIMEDOUT;
四、总结 非阻塞connect接口主要用于控制连接的时间,防止异常连接带来的过长的CPU占用;
而需要注意的是select 对套接字有所限制,当进程已经开启1024个fd后,select 接口将会导致错误,得考虑换成 epoll_wait 接口;
并且再进一步考虑时,就得考虑可移植性了,网上所说的主要围绕 getsockopt 函数的可移植问题;


参考文章:
[1] Socket连接超时, http://www.cnblogs.com/highriver/archive/2012/01/16/2324035.html
[2] 关于阻塞非阻塞, http://blog.csdn.net/hguisu/article/details/7453390


    推荐阅读