只要稍微接触Socket套接字进行过网络编程的人,对Socket客户端调用流程或服务端调用流程都会很熟悉,传输层协议采用TCP也好,或UDP也罢。但是要写好这套“固化”的流程代码,如果稍不小心,或缺乏经历,还是很容易犯错误的,尤其当项目程序在迭代开发过程中,功能越来越多,也越来越复杂的情况下。
就在前几天,我碰到了这样一个细节问题。
协议栈Demo程序中有个设备校时的功能,采用NTP协议进行设备间的时钟同步。Demo程序在我和一位同事的PC (操作系统为MS XP)上测试时钟同步,怎么测,都没问题。但是拿到Windows 7系统下,却可能会发生问题,后来我在Windows Server 2003系统下,也碰到这个问题。
Demo A要向 Demo B发送登录请求,登出……并发送时钟同步请求(A向B登录请求时创建的套接字和A向B时钟同步请求创建的套接字不同),A 也要向Demo C登录;B向C登录。在Windows 7系统下,若打开A和B,A直接向B时钟同步请求,结果成功;若先打开A和C,A向C登录成功后,再打开B,A向B时钟同步请求,则失败。但该问题在开发环境PC XP系统下不会发生,后来在和另一位同事的共同努力下,最终找到了问题所在,并改掉了此Bug,不亦乐乎!
下边我写了一个简易的测试程序,再现了造成时钟同步请求可能会失败的关键所在。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 |
#include <winsock2.h> #include <stdio.h> #pragma comment(lib, "WS2_32") // 链接到WS2_32.lib /* 1,测试设置 套接字sock1绑定地址信息:IP = 127.0.0.1,Port = 4567 套接字sock2绑定地址信息:IP = INADDR_ANY,Port = 4567 2,测试结果: 下列代码编译程序udp_bind.exe(Release)在XP系统下运行,只有sock1套接字发送数据成功,而sock2套接字在绑定时失败 将udp_bind.exe在MS Server 2003系统下运行,则sock2和sock2均发送成功 3,测试总结: 在使用UDP协议创建套接字,绑定本地地址时,本地地址IP应该使用同种模式,即INADDR_ANY,否则不同的套接字可能绑定到相同的端口 */ SOCKET CreateSock(char *psLocalIP, unsigned short usLocalPort) { //创建套节字 SOCKET sock = ::socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP); if( INVALID_SOCKET == sock ) { printf("Failed socket() %d \n", ::WSAGetLastError()); return 0; } //绑定本地地址 sockaddr_in addrLocal; memset(&addrLocal, 0, sizeof(addrLocal)); addrLocal.sin_family = AF_INET; |
1 2 3 4 5 6 7 8 9 |
if ( '\0' == psLocalIP[0] ) { addrLocal.sin_addr.s_addr = htonl(INADDR_ANY); } else { addrLocal.sin_addr.s_addr = inet_addr(psLocalIP); } addrLocal.sin_port = htons(usLocalPort); |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 |
if ( 0 != bind(sock, (struct sockaddr*)&addrLocal, sizeof(addrLocal)) ) { printf("Failed bind() %d \n", ::WSAGetLastError()); closesocket(sock); return 0; } return sock; } int main(int argc, char* argv[]) { // 初始化WS2_32.dll WSADATA wsaData; WORD sockVersion = MAKEWORD(2, 2); if(::WSAStartup(sockVersion, &wsaData) != 0) { exit(0); } SOCKET sock1 = CreateSock("127.0.0.1", 4567); if ( 0 == sock1 ) { printf("Failed create sock1 \n"); } //int iOn = 1; int iRet = 0; //iRet = setsockopt(sock1,SOL_SOCKET,SO_REUSEADDR,(char*)&iOn,sizeof(iOn)); SOCKET sock2 = CreateSock("", 4567); if ( 0 == sock2 ) { printf("Failed create sock2 \n"); } //填写远程地址信息 sockaddr_in addrRemote; addrRemote.sin_family = AF_INET; addrRemote.sin_port = htons(5678); addrRemote.sin_addr.S_un.S_addr = inet_addr("127.0.0.1"); char szText[] = " Hello UDP! \r\n"; iRet = ::sendto(sock1, szText, strlen(szText), 0, (sockaddr*)&addrRemote, sizeof(addrRemote)); if ( SOCKET_ERROR == iRet ) { printf("Failed sendto() sock1 %d \n", ::WSAGetLastError()); closesocket(sock1); } else { printf("Successed sendto sock1 = %d, data lenth = %d \n", sock1, iRet); } iRet = ::sendto(sock2, szText, strlen(szText), 0, (sockaddr*)&addrRemote, sizeof(addrRemote)); if ( SOCKET_ERROR == iRet ) { printf("Failed sendto() sock2 %d \n", ::WSAGetLastError()); closesocket(sock2); } else { printf("Successed sendto sock2 = %d, data lenth = %d \n", sock2, iRet); } system("pause"); closesocket(sock1); closesocket(sock2); ::WSACleanup(); return 0; } |
下面是udp_bind.exe在XP系统下的运行结果截图
下面是在Server 2003系统下的截图
相同的代码在不同的系统下跑出不同的结果,令人有些费解!将上述测试代码中对应地方改为如下,就OK了。
1 2 3 4 5 6 7 8 |
//if ( '\0' == psLocalIP[0] ) //{ addrLocal.sin_addr.s_addr = htonl(INADDR_ANY); //} //else //{ // addrLocal.sin_addr.s_addr = inet_addr(psLocalIP); //} |
看到这里,您也应该明白我们Demo程序中时钟同步的问题所在了吧?
俗话说,细节决定成败。
不论做产品,做项目,还是开发网络程序,都会面对很多细节问题,要重视你碰到的细节问题!
发表评论
要发表评论,您必须先登录。