Socket编程中select函数的用法详解

select() 在 SOCKET 编程中还是比较重要的,可是对于初学 SOCKET 的人来说都不太爱用 select() 写程序,他们只是习惯写诸如 conncet()、accept()、recv() 或 recvfrom() 这样的阻塞程序(所谓阻塞方式 block,顾名思义,就是进程或是线程执行到这些函数时必须等待某个事件发生,如果事件没有发生,进程或线程就被阻塞,函数不能立即返回)。可是使用 select() 就可以完成非阻塞(所谓非阻塞方式 non-block,就是进程或线程执行此函数时不必非要等待事件的发生,一旦执行肯定返回,以返回值的不同来反映函数的执行情况。如果事件发生则与阻塞方式相同,若事件没有发生则返回一个代码来告知事件未发生,而进程或线程继续执行,所以效率高)方式工作的程序,它能够监视我们需要监视的文件描述符的变化情况——读写或是异常。下面详细介绍一下!
select() 函数的格式(我所说的是 Unix 系统下的 Berkeley Socket 编程,和 Windows 下的有区别,一会儿说明):
int select(int maxfdp, fd_set* readfds, fd_set* writefds, fd_set* errorfds, struct timeval* timeout);
先说明两个结构体:
第一:struct fd_set 可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,这可以是我们所说的普通意义的文件,当然 Unix 下任何设备、管道、FIFO 等都是文件形式,全部包括在内,所以,毫无疑问,一个 socket 就是一个文件,socket 句柄就是一个文件描述符。fd_set 集合可以通过一些宏由人为来操作,比如清空集合:FD_ZERO(fd_set*),将一个给定的文件描述符加入集合之中 FD_SET(int, fd_set*),将一个给定的文件描述符从集合中删除 FD_CLR(int,fd_set*),检查集合中指定的文件描述符是否可以读写 FD_ISSET(int, fd_set*)。一会儿举例说明。
第二:struct timeval 是一个大家常用的结构,用来代表时间值,有两个成员,一个是秒数,另一个是微妙数(不是毫秒)。
具体解释 select 的参数:
int maxfdp 是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在 Windows 中这个参数值无所谓,可以设置不正确。
fd_set* readfds 是指向 fd_set 结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select 就会返回一个大于 0 的值,表示可读取的文件数量,如果没有可读的文件,则根据 timeout 参数再判断是否超时,若超出 timeout 的时间,select 返回 0,若发生错误返回负值。这个参数也可以传入 NULL 值,表示不关心任何文件的读变化。
fd_set* writefds 是指向 fd_set 结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select 就会返回一个大于 0 的值,表示可写入的文件数量,如果没有可写的文件,则根据 timeout 参数再判断是否超时,若超出 timeout 的时间,select 返回 0,若发生错误返回负值。这个参数也可以传入 NULL值,表示不关心任何文件的写变化。
fe_set* errorfds 同上面两个参数的一样,用来监视文件错误异常。
struct timeval* timeout 是 select 的超时时间,这个参数至关重要,它可以使 select 处于三种状态。
第一:若将 NULL 以形参传入,即不传入时间结构,就是将 select 置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;
第二:若将时间值设为 0 秒 0 微妙,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回 0,有变化返回一个正值;
第三:timeout 的值大于 0,这就是等待的超时时间,即 select 在 timeout 时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。
返回值:
负值:select错误
正值:某些文件可读写或出错
0:等待超时,没有可读写或错误的文件
在有了 select 后可以写出像样的网络程序来!举个简单的例子,就是从网络上接受数据写入一个文件中。
=============无连接============
例子:
int main()
{
【Socket编程中select函数的用法详解】int sock;
FILE* fp;
struct fd_set fds;
struct timeval timeout = {3, 0}; // select 等待 3 秒,3 秒轮询, 要非阻塞就置 0
char buffer[256] = {0}; // 256 字节的接收缓冲区
/* 假设已经建立 UDP 连接,具体过程不写,简单,当然 TCP 也同理,主机 IP 和 port 都已经给定,要写的文件已经打开 */
sock = socket(...);
bind(...);
fp = fopen(...); */
while(1)
{
FD_ZERO(&fds); // 每次循环都要清空,否则不能检测描述符变化
FD_SET(sock, &fds); // 添加套接字描述符
FD_SET(fp, &fds); // 添加文件描述符
maxfdp = sock>fp ? sock+1 : fp+1; //描述符最大值加1
switch(select(maxfdp, &fds, &fds, NULL, &timeout)) // select 使用
{
case SOCKET_ERROR: exit(-1); break; //select 错误,退出程序
case 0: break; //再次轮询
default:
if(FD_ISSET(sock, &fds)) // 测试sock是否可读,即是否网络上有数据
{
recvfrom(sock, buffer, 256, .... ); //接受网络数据
if(FD_ISSET(fp, &fds)) //测试文件是否可写
fwrite(fp, buffer...); //写入文件
// buffer清空;
} //end if break
} //end switch
} //end while
} //end main

==================面向连接===================
#include
#include

#define PORT5150
#define MSGSIZE1024

#pragma comment(lib, "ws2_32.lib")

intg_iTotalConn = 0;
SOCKET g_CliSocketArr[FD_SETSIZE];
DWORD WINAPI WorkerThread(LPVOID lpParameter);

int main()
{
WSADATAwsaData;
SOCKETsListen, sClient;
SOCKADDR_IN local, client;
intiaddrSize = sizeof(SOCKADDR_IN);
DWORDdwThreadId;

// Initialize Windows socket library
WSAStartup(0x0202, &wsaData);
// Create listening socket
sListen = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
// Bind
local.sin_addr.S_un.S_addr = htonl(INADDR_ANY);
local.sin_family = AF_INET;
local.sin_port = htons(PORT);
bind(sListen, (struct sockaddr *)&local, sizeof(SOCKADDR_IN));
// Listen
listen(sListen, 3);
// Create worker thread
CreateThread(NULL, 0, WorkerThread, NULL, 0, &dwThreadId);
while (TRUE)
{
// Accept a connection
sClient = accept(sListen, (struct sockaddr *)&client, &iaddrSize);
printf("Accepted client:%s:%d\n", inet_ntoa(client.sin_addr), ntohs(client.sin_port));
// Add socket to g_CliSocketArr
g_CliSocketArr[g_iTotalConn++] = sClient;
}
return 0;
}

DWORD WINAPI WorkerThread(LPVOID lpParam)
{
inti;
fd_setfdread;
intret;
struct timeval tv = {1, 0};
charszMessage[MSGSIZE];

while (TRUE)
{
FD_ZERO(&fdread);
for (i = 0; i < g_iTotalConn; i++)
{
FD_SET(g_CliSocketArr[i], &fdread);
}// We only care read event
ret = select(0, &fdread, NULL, NULL, &tv);
if (ret == 0)
{// Time expired
continue;
}
for (i = 0; i < g_iTotalConn; i++)
{
if (FD_ISSET(g_CliSocketArr[i], &fdread))
{// A read event happened on g_CliSocketArr
ret = recv(g_CliSocketArr[i], szMessage, MSGSIZE, 0);
if (ret == 0 || (ret == SOCKET_ERROR && WSAGetLastError() == WSAECONNRESET))
{
// Client socket closed
printf("Client socket %d closed.\n", g_CliSocketArr);
closesocket(g_CliSocketArr);
if (i < --g_iTotalConn)
{
g_CliSocketArr[i] = g_CliSocketArr[g_iTotalConn];
}
}
else
{
// We received a message from client
szMessage[ret] = '\0';
send(g_CliSocketArr, szMessage, strlen(szMessage), 0);
}
} //if
}//for
}//while
return 0;
}
服务器的几个主要动作如下:
1.创建监听套接字,绑定,监听;
2.创建工作者线程;
3.创建一个套接字数组,用来存放当前所有活动的客户端套接字,每 accept 一个连接就更新一次数组;
4.接受客户端的连接。
这里有一点需要注意的,就是我没有重新定义 FD_SETSIZE 宏,所以服务器最多支持的并发连接数为64。而且,这里决不能无条件的accept,服务器应该根据当前的连接数来决定是否接受来自某个客户端的连接。一种比较好的实现方案就是采用 WSAAccept 函数,而且让WSAAccept 回调自己实现的 Condition Function。
如下所示:
int CALLBACK ConditionFunc(LPWSABUF lpCallerId,LPWSABUF lpCallerData, LPQOS lpSQOS,LPQOS lpGQOS,LPWSABUF lpCalleeId, LPWSABUF lpCalleeData,GROUP FAR *
g,DWORD dwCallbackData)
{
if (当前连接数 < FD_SETSIZE)
return CF_ACCEPT;
else
return CF_REJECT;
}
工作者线程里面是一个死循环,一次循环完成的动作是:
1.将当前所有的客户端套接字加入到读集fdread中;
2.调用select函数;
3.查看某个套接字是否仍然处于读集中,如果是,则接收数据。如果接收的数据长度为 0,或者发生 WSAECONNRESET 错误,则表示客户端套接字主动关闭,这时需要将服务器中对应的套接字所绑定的资源释放掉,然后调整我们的套接字数组(将数组中最后一个套接字挪到当前的位置上)。
除了需要有条件接受客户端的连接外,还需要在连接数为 0 的情形下做特殊处理,因为如果读集中没有任何套接字,select 函数会立刻返回,这将导致工作者线程成为一个毫无停顿的死循环,CPU 的占用率马上达到 100%。
关系到套接字列表的操作都需要使用循环,在轮询的时候,需要遍历一次,再新的一轮开始时,将列表加入队列又需要遍历一次。也就是说,Select在工作一次时,需要至少遍历2次列表,这是它效率较低的原因之一。
在大规模的网络连接方面,还是推荐使用 IOCP 或 EPOLL 模型。但是 Select 模型可以使用在诸如对战类游戏上,比如类似星际这种,因为它小巧易于实现,且对战类游戏的网络连接量并不大。对于 Select 模型想要突破Windows 64个限制的话,可以采取分段轮询,一次轮询64个。例如套接字列表为128个,在第一次轮询时,将前64个放入队列中用 Select 进行状态查询,待本次操作全部结束后,将后64个再加入轮询队列中进行轮询处理。这样处理需要在非阻塞式下工作。以此类推,Select也能支持无限多个。

    推荐阅读