【Linux网络编程】TCP套接字
TCP与UDP的区别:
udp是无连接的、面向数据报(通信时以数据报为单位传输)的传输层通信协议,其中每个数据报都是独立的,通信之前不需要建立连接,bind绑定套接字后直接可以进行通信。
tcp是面向连接的、基于字节流(通信时以字节为单位传输)的传输层通信协议,所以通信之前必须先建立连接。其中服务器是被连接的,需要等待客户端的连接。
这里着重说明下,TCP的面向字节流意味着在发送和接收数据时是以字节为单位进行的。TCP协议在传输数据时,将数据视为连续的字节流。这意味着,虽然应用程序和TCP的交互可能是一次一个数据块(大小不等),但TCP在传输层会将这些数据块看作是一连串的字节,并依次进行传输。接收端在收到这些字节后,会按照发送端的顺序重新组合成原始数据。UDP是以数据报为单位进行的,将信息分割成独立的信息或报文。具体原理后面文章会详细说明。
TCP中的发送和接收函数:
注意:在TCP套接字通信中,接收和发送数据时不能使用recvfrom和sendto函数。TCP是面向字节流的,UDP是面向数据报的,recvfrom和sendto两函数是依赖于数据包的来源地址和端口进行通信,读取和发送都是一个一个数据报的形式,是专门为UDP协议规则设计的,而TCP通信时是通过已经建立的连接进行且是字节流的形式,不需要指定目标地址和端口。因此,在设计网络应用程序时,需要根据所使用的协议(TCP或UDP)选择合适的函数。
TCP通信时通常使用write(发送数据)和read(接收数据)或者send(发送数据)和recv(接收数据)。这两套函数都是面向字节流发送和接收数据的,用法与sendto和recvfrom用法类似,这里不做说明,具体的使用后面会做代码演示。
TCP套接字必备的函数接口:
1,listen。该函数用于将套接字设置为监听状态,这是一种被动模式,即将其标记为用于接受客户端连接请求的套接字,以接受来自客户端的连接请求。这个函数通常在服务器程序中调用,通常是在服务器进程正在准备好接受来自客户端的连接,并在调用 bind
函数时将套接字与特定地址(IP地址和端口号)关联之后使用。
当listen函数被调用时,它告诉内核这个套接字现在处于被动模式,并准备接受客户端的连接请求。内核会在自己的进程空间里维护一个队列来跟踪这些连接请求。当客户端尝试连接到服务器时,它们的连接请求会被放入这个队列中。服务器进程可以调用accept函数来从这个等待队列中取出连接请求并建立新的连接。
头文件:
#include <sys/types.h>
#include <sys/socket.h>格式:
int listen(int sockfd, int backlog);
参数说明:
sockfd
:要监听套接字的文件描述符。backlog
:指定系统内核应为相应套接字排队的最大连接数,即最多有多少个客户端可以同时处于连接等待状态。如果接收到更多的连接请求,这些请求将被忽略。它通常是一个较小的整数,如2到4,也可以设置为系统定义的最大值:SOMAXCONN。
返回值:
成功时,返回0;失败时,返回-1。
2,accept。该函数是在实现基于 TCP/IP 协议的服务器端程序时,用于从监听套接字上接受一个连接请求(从等待队列中取出一个已完成的连接),并创建一个新的套接字,该套接字将用于与客户端进行通信。此函数通常在调用 listen 函数之后使用,listen 函数会使服务器套接字进入监听状态,等待客户端的连接请求。
头文件:
#include <sys/types.h>
#include <sys/socket.h>
格式:
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
参数说明:
- sockfd:一个监听套接字的描述符,该套接字是通过
listen
函数设置为监听状态的套接字。- addr:指向
sockaddr
结构体的指针,该结构体用于存储接受连接的地址信息。如果不需要这些信息,可以将其设置为NULL
。- addrlen:指向包含
addr
结构体大小的变量的指针。函数返回时,它会被更新为实际存储在addr
地址中的实际大小。如果addr
是NULL
,则addrlen
也为NULL
。返回值:
成功时,返回一个非负值,这个值是一个新的套接字描述符,用于与接收到的客户端连接进行通信。
失败时,返回 -1。
注意:accept返回的套接字与listen监听的套接字在TCP/IP网络通信中扮演着不同的角色。listen监听的套接字是用于服务端进入监听状态,等待来自客户端的连接请求。它不会直接用于数据的发送和接收,而是作为接受连接请求的入口。 该套接字在服务器的整个生命周期中只被创建一次且只有一个(对于每个监听的端口)。accept返回的套接字是用于与客户端进行实际的通信,即数据的发送和接收。当服务器监听到客户端的连接请求后,服务器会通过accept函数从监听套接字的等待队列中取出一个连接请求,并创建一个新的套接字(即已连接套接字,用于与客户端通信)。该套接字只存在于服务器为一个客户端服务的过程中。一旦与客户端的连接关闭,该套接字就会被销毁。
3,connect。该函数用于TCP客户端与TCP服务器建立连接。当调用此函数时,TCP客户端会发起三次握手操作(具体细节后面理论文章说明),尝试与服务器建立连接。
头文件:
#include <sys/types.h>
#include <sys/socket.h>
格式:
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数说明:
sockfd
:由socket
函数返回的套接字描述符,代表客户端的套接字。addr
:一个指向包含服务器IP地址和端口号的地址结构的指针。addrlen
:addr
地址的大小。返回值:
如果连接成功,函数返回0;如果连接失败,函数返回-1。
TCP服务端的连接处理:
由于TCP通信是建立在客户端连接上进行的,而这里的连接服务器如同 “排队买饭,一次一人” 道理,所以,TCP通信的服务端一次只能处理一个客户端的连接请求,其它客户端的连接请求需要被服务器等待处理,直到当前连接的客户端断开为止其它客户端才能连接,即多个客户端不会同时绑定一个服务器连接。为了实现多个客户端与服务器的同时通信,服务器通常需要使用多线程、多进程(不推荐)、进程池(不推荐)、线程池或异步处理机制(这里可理解为一个执行流不能在相同时间内绑定多个连接)等。这样,服务器可以同时处理多个客户端的请求,而不会造成阻塞或延迟。
close关闭套接字:
close函数用于关闭套接字且释放其资源。
对于TCP套接字,close函数的调用是非常重要的。在TCP中,套接字的建立与连接是一个有序的过程,保证其可靠性,如果不关闭TCP套接字,可能会导致资源泄漏(如文件描述符、内存等),并且服务器可能会认为客户端仍然连接着,从而保持不必要的状态信息。
对于UDP套接字,情况有所不同。由于UDP是无连接的协议,每个数据报都是独立的,并且不保证顺序或可靠性,因此没有像TCP那样的连接状态需要维护。这意味着UDP套接字不需要像TCP套接字那样经历一个有序的关闭过程。但是,调用close
函数仍然是一个好习惯,因为它会释放由套接字占用的系统资源。这些资源包括文件描述符、内存缓冲区等。如果不关闭UDP套接字,这些资源将不会被释放,将会导致资源泄露。
TCP套接字代码示例:
TCP套接字这里设计了单进程单线程、多进程、多线程版本,相关代码请在此链接下观看:TCP套接字的代码实现