网络通信关键函数理解

sockaddr_in

当我们调用bind()、connect()等函数时,都需传入一个struct sockaddr *类型指针,用来表明地址信息,即需对哪个IP、哪个端口进行bind或connect操作。这时,我们传给函数关于地址信息的参数会强制转换成sockaddr_in类型的形式,即struct sockaddr是通用的套接字地址形式。
在linux环境下,结构体struct sockaddr在/usr/include/linux/socket.h中定义,具体如下:

1
2
3
4
5
6
typedef unsigned short sa_family_t;
struct sockaddr {
sa_family_t sa_family; /* address family, AF_xxx */
char sa_data[14]; /* 14 bytes of protocol address */
}

  • sa_family是地址家族,一般以”AF_xxx”形式存在,通常为AF_INET,代表TCP/IP协议簇
  • sa_data是14字节协议地址
    • 4个字节的无符号整数(IP地址)
    • 2个字节的无符号整数(端口号)

从sockaddr的定义中,无法确定IP地址和端口号在这14个字节地址空间中的存放位置。因此,进行参数传递时,还需知道这14个字节的空间是如何利用,即哪里放IP地址、哪里放端口号、哪里是空白。
于是,在此基础上,构造了sockaddr_in的结构体。
在linux环境下,结构体struct sockaddr_in在/usr/include/netinet/in.h中定义,具体如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
/* Structure describing an Internet socket address. */
struct sockaddr_in
{
__SOCKADDR_COMMON (sin_family); /* Address family */
in_port_t sin_port; /* Port number. */
struct in_addr sin_addr; /* Internet address. */
/* Pad to size of `struct sockaddr'. */
unsigned char sin_zero[sizeof (struct sockaddr) -
__SOCKADDR_COMMON_SIZE -
sizeof (in_port_t) -
sizeof (struct in_addr)];
/* 字符数组sin_zero[8]的存在是为了保证结构体struct sockaddr_in的大小和结构体struct sockaddr的大小相等 */
};
typedef unsigned short int sa_family_t;
#define __SOCKADDR_COMMON(sa_prefix) \
sa_family_t sa_prefix##family /*此为整型变量占2字节,主要用于指明地址类型,取值为AF_UNIX|AF_INET|AF_INET6|AF_PACKET等*/

  • sin_family指代协议族,在socket编程中只能是AF_INET
  • sin_port存储端口号(使用网络字节顺序)
  • sin_addr存储IP地址,使用in_addr这个数据结构
  • sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节

下面是struct sockaddr_in中用到两个数据类型,具体定义如下:

1
2
3
4
5
6
7
/* Type to represent a port. */
typedef uint16_t in_port_t;
struct in_addr其实就是32位IP地址
struct in_addr {
unsigned long s_addr;
};

s_addr按照网络字节顺序存储IP地址

  • struct sockaddr是通用的套接字地址形式
  • struct sockaddr_in是Internet下套接字的地址形式

sockaddr_in和sockaddr长度均为16字节,是并列结构,指向sockadd_in结构的指针,也可指向sockaddr的结构体。也就是说,你使用sockaddr_in建立你所需要的信息,然后按照函数要求进行类型转换就可以了。
比如:

1
2
3
4
5
sockaddr_in mySock;
bzero((char *)&mySock,sizeof(mySock));
mySock.sa_family = AF_INET;
mySock.sin_port = htons(1234);
mySock.sin_addr.s_addr = inet_addr("192.168.1.1");

在一般构建网络通信过程中,需将sockaddr_in结构强制转换成sockaddr结构,再传入系统调用函数中。通常,BSD网络软件中包含了两个函数,用来在二进制地址格式和点分十进制字符串格式之间相互转换,但是这两个函数仅仅支持IPv4。

1
2
in_addr_t inet_addr(const char *cp);
char *inet_ntoa(struct in_addr in);

功能相似的两个函数同时支持IPv4和IPv6

1
2
const char *inet_ntop(int domain, const void *addr, char *str, socklen_t size);
int inet_pton(int domain, const char *str, void *addr);

通常用法

1
2
3
4
5
6
7
8
9
int sockfd;
struct sockaddr_in my_addr;
sockfd = socket(AF_INET, SOCK_STREAM, 0);
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(MYPORT);
my_addr.sin_addr.s_addr = inet_addr("192.168.1.1");
bzero(&(my_addr.sin_zero), 8));
//memset(&(my_addr.sin_zero), 0, 8);
bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

总结

在进行网络编程时,常常使用的函数如bind()、connect()函数都已定义好。在这些函数传参过程中,需按照参数的标准类型进行传递。而定义struct sockaddr时,往往不能确定网络地址和端口号在内存中的具体存储。于是,使用struct sockaddr_in将存储地址定义清楚。在此之后,由于其结构空间一样,可直接进行类型转换,就如(int )转换成(float )一样。