当前位置：首页 > article >正文

【Linux网络编程】TCP套接字

article 2025/2/25 2:24:49

TCP与UDP的区别：

udp是无连接的、面向数据报（通信时以数据报为单位传输）的传输层通信协议，其中每个数据报都是独立的，通信之前不需要建立连接，bind绑定套接字后直接可以进行通信。

tcp是面向连接的、基于字节流（通信时以字节为单位传输）的传输层通信协议，所以通信之前必须先建立连接。其中服务器是被连接的，需要等待客户端的连接。

这里着重说明下，TCP的面向字节流意味着在发送和接收数据时是以字节为单位进行的。TCP协议在传输数据时，将数据视为连续的字节流。这意味着，虽然应用程序和TCP的交互可能是一次一个数据块（大小不等），但TCP在传输层会将这些数据块看作是一连串的字节，并依次进行传输。接收端在收到这些字节后，会按照发送端的顺序重新组合成原始数据。UDP是以数据报为单位进行的，将信息分割成独立的信息或报文。具体原理后面文章会详细说明。

TCP中的发送和接收函数：

注意：在TCP套接字通信中，接收和发送数据时不能使用recvfrom和sendto函数。TCP是面向字节流的，UDP是面向数据报的，recvfrom和sendto两函数是依赖于数据包的来源地址和端口进行通信，读取和发送都是一个一个数据报的形式，是专门为UDP协议规则设计的，而TCP通信时是通过已经建立的连接进行且是字节流的形式，不需要指定目标地址和端口。因此，在设计网络应用程序时，需要根据所使用的协议（TCP或UDP）选择合适的函数。

TCP通信时通常使用write（发送数据）和read（接收数据）或者send（发送数据）和recv（接收数据）。这两套函数都是面向字节流发送和接收数据的，用法与sendto和recvfrom用法类似，这里不做说明，具体的使用后面会做代码演示。

TCP套接字必备的函数接口：

1，listen。该函数用于将套接字设置为监听状态，这是一种被动模式，即将其标记为用于接受客户端连接请求的套接字，以接受来自客户端的连接请求。这个函数通常在服务器程序中调用，通常是在服务器进程正在准备好接受来自客户端的连接，并在调用 bind 函数时将套接字与特定地址（IP地址和端口号）关联之后使用。

当listen函数被调用时，它告诉内核这个套接字现在处于被动模式，并准备接受客户端的连接请求。内核会在自己的进程空间里维护一个队列来跟踪这些连接请求。当客户端尝试连接到服务器时，它们的连接请求会被放入这个队列中。服务器进程可以调用accept函数来从这个等待队列中取出连接请求并建立新的连接。

头文件：

        #include <sys/types.h>
#include <sys/socket.h>

格式：

        int listen(int sockfd, int backlog);

参数说明：

sockfd：要监听套接字的文件描述符。
backlog：指定系统内核应为相应套接字排队的最大连接数，即最多有多少个客户端可以同时处于连接等待状态。如果接收到更多的连接请求，这些请求将被忽略。它通常是一个较小的整数，如2到4，也可以设置为系统定义的最大值：SOMAXCONN。

返回值：

        成功时，返回0；失败时，返回-1。

2，accept。该函数是在实现基于 TCP/IP 协议的服务器端程序时，用于从监听套接字上接受一个连接请求（从等待队列中取出一个已完成的连接），并创建一个新的套接字，该套接字将用于与客户端进行通信。此函数通常在调用 listen 函数之后使用，listen 函数会使服务器套接字进入监听状态，等待客户端的连接请求。

头文件：

        #include <sys/types.h>

        #include <sys/socket.h>

格式：

        int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

参数说明：

sockfd：一个监听套接字的描述符，该套接字是通过 listen 函数设置为监听状态的套接字。
addr：指向 sockaddr 结构体的指针，该结构体用于存储接受连接的地址信息。如果不需要这些信息，可以将其设置为 NULL。
addrlen：指向包含 addr 结构体大小的变量的指针。函数返回时，它会被更新为实际存储在 addr 地址中的实际大小。如果 addr 是 NULL，则 addrlen 也为 NULL。

返回值：

        成功时，返回一个非负值，这个值是一个新的套接字描述符，用于与接收到的客户端连接进行通信。

        失败时，返回 -1。

注意：accept返回的套接字与listen监听的套接字在TCP/IP网络通信中扮演着不同的角色。listen监听的套接字是用于服务端进入监听状态，等待来自客户端的连接请求。它不会直接用于数据的发送和接收，而是作为接受连接请求的入口。该套接字在服务器的整个生命周期中只被创建一次且只有一个（对于每个监听的端口）。accept返回的套接字是用于与客户端进行实际的通信，即数据的发送和接收。当服务器监听到客户端的连接请求后，服务器会通过accept函数从监听套接字的等待队列中取出一个连接请求，并创建一个新的套接字（即已连接套接字，用于与客户端通信）。该套接字只存在于服务器为一个客户端服务的过程中。一旦与客户端的连接关闭，该套接字就会被销毁。

3，connect。该函数用于TCP客户端与TCP服务器建立连接。当调用此函数时，TCP客户端会发起三次握手操作（具体细节后面理论文章说明），尝试与服务器建立连接。

头文件：

        #include <sys/types.h>

        #include <sys/socket.h>

格式：

        int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数说明：

sockfd：由socket函数返回的套接字描述符，代表客户端的套接字。
addr：一个指向包含服务器IP地址和端口号的地址结构的指针。
addrlen：addr地址的大小。

返回值：

        如果连接成功，函数返回0；如果连接失败，函数返回-1。

TCP服务端的连接处理：

由于TCP通信是建立在客户端连接上进行的，而这里的连接服务器如同 “排队买饭，一次一人” 道理，所以，TCP通信的服务端一次只能处理一个客户端的连接请求，其它客户端的连接请求需要被服务器等待处理，直到当前连接的客户端断开为止其它客户端才能连接，即多个客户端不会同时绑定一个服务器连接。为了实现多个客户端与服务器的同时通信，服务器通常需要使用多线程、多进程（不推荐）、进程池（不推荐）、线程池或异步处理机制（这里可理解为一个执行流不能在相同时间内绑定多个连接）等。这样，服务器可以同时处理多个客户端的请求，而不会造成阻塞或延迟。

close关闭套接字：

close函数用于关闭套接字且释放其资源。

对于TCP套接字，close函数的调用是非常重要的。在TCP中，套接字的建立与连接是一个有序的过程，保证其可靠性，如果不关闭TCP套接字，可能会导致资源泄漏（如文件描述符、内存等），并且服务器可能会认为客户端仍然连接着，从而保持不必要的状态信息。

对于UDP套接字，情况有所不同。由于UDP是无连接的协议，每个数据报都是独立的，并且不保证顺序或可靠性，因此没有像TCP那样的连接状态需要维护。这意味着UDP套接字不需要像TCP套接字那样经历一个有序的关闭过程。但是，调用close函数仍然是一个好习惯，因为它会释放由套接字占用的系统资源。这些资源包括文件描述符、内存缓冲区等。如果不关闭UDP套接字，这些资源将不会被释放，将会导致资源泄露。