我们在实际应用中很可能遇到这样的情况:客户端与服务器之间已经建立了TCP长连接,他们之间正在进行数据通信,尚未主动执行close操作的时候,突然一方拔掉网线或者断电,双方会因为无法交互断开TCP连接的握手包而一直无法确认是否与对方断开连接。这个时候执行read或recvfrom操作会因为无法收到数据使得进程一直阻塞着而不会返回错误,write操作因为是向缓冲区内写数据,只要缓冲区未满则也不会返回错误。这样,异常断开的TCP连接所绑定的套接字(文件描述符)已经没有意义了,但仍然占用着一个位置,倘若不处理,无意义的套接字(文件描述符)累加到1024时,系统会因为无法再分配新的套接字(文件描述符)而无法接受新的TCP连接。
为了解决这一潜在的问题,我们通常有两种解决办法:一种是客户端与服务器之间维持一个心跳包,一段时间无法收到对方的应答则可视为连接断开,主动执行close操作即可回收异常断开的TCP连接;另一种是采用Linux系统自带的TCP keepAlive心跳包机制。由于后者不是所有的系统都支持,为了提高程序的可移植性,更建议使用前者。
由于前者实现机制因人而异,就不举例说明了,这里着重实现后者。下面是封装好的一个C语言函数实例:
#include <netinet/tcp.h> int set_tcp_keepAlive(int fd, int start, int interval, int count) { int keepAlive = 1; if (fd < 0 || start < 0 || interval < 0 || count < 0) return -1; //启用心跳机制,如果您想关闭,将keepAlive置零即可 if(setsockopt(fd,SOL_SOCKET,SO_KEEPALIVE,(void*)&keepAlive,sizeof(keepAlive)) == -1) { perror("setsockopt"); return -1; } //启用心跳机制开始到首次心跳侦测包发送之间的空闲时间 if(setsockopt(fd,SOL_TCP,TCP_KEEPIDLE,(void *)&start,sizeof(start)) == -1) { perror("setsockopt"); return -1; } //两次心跳侦测包之间的间隔时间 if(setsockopt(fd,SOL_TCP,TCP_KEEPINTVL,(void *)&interval,sizeof(interval)) == -1) { perror("setsockopt"); return -1; } //探测次数,即将几次探测失败判定为TCP断开 if(setsockopt(fd,SOL_TCP,TCP_KEEPCNT,(void *)&count,sizeof(count)) == -1) { perror("setsockopt"); return -1; } return 0; }
将想设置的参数传入该函数,设置成功返回0,否则返回-1。设置成功以后,可以将fd交给select去监听可读可写事件,如果select检测到fd可读且read返回错误,一般就能判定该fd对应的TCP连接已经异常断开,调用close函数将fd关闭即可。异常断开的TCP连接得到回收。该函数在您想检查TCP连接状态的任意时刻(主动close前)调用都有效,只有调用并设置成功以后方能检测TCP连接状态,所以得执行该函数以后再调用select函数。
除非注明,文章均为CppLive 编程在线原创,转载请注明出处,谢谢。
如果我们没有服务器软件的源码,如何关闭呢?
要构建RST包吗?
没有源码恐怕就只能试试RST包了
Linux我只限于安装,没用心学业没认证用~O(∩_∩)O哈哈~
我在你这个时候也是这状态,工作以后有需要情况就不同了。你现在还早,能安装下足以,不过工作以后会发现Linux在我们行业的重要性的,嘿嘿~