计算机网络(运输层)
物理层、数据链路层以及网络层共同解决了将主机通过异构网络互联起来所面临的问题,实现了主机与主机之间的通信。
实际上在计算机网络中进行通信的真正实体事位于通信两端主机中的进程。
运输层的任务就会是提供运行在不同主机上的应用进程提供直接的通信服务,又称端到端协议。
根据应用的需求不同,因特网的运输层为应用层提供了两种不同的运输协议,即面向连接的TCP和无连接的UDP。
运输层端口号、复用、分用
TCP/IP体系的运输层使用端口号来区分应用层的不同应用进程。
端口号用16比特表示,取值范围0~65535
端口号只具有本地意义,即端口号只是为了标识本计算机应用层中的各进程,在因特网中,不同计算机中的相同的端口号是没有联系的。
复用和分用:发送方的某些应用进程所发送的不同应用报文,在运输层使用UDP协议进行封装,称为UDP复用。使用TCP协议进行封装称为TCP复用。
TCP/IP体系的应用层常用协议所使用的运输层熟知端口号
UDP和TCP的区别
UDP(User Datagram Protocol)用户数据报协议
·UDP是无连接的
·UDP支持单播、多播以及广播
·UDP是面向应用报文的
·UDP向上层提供无连接不可靠传输服务(适用于IP电话、视频会议等实时应用)
·UDP用户数据报首部仅8字节
TCP(Transmission Control Protocol)
·TCP是面向连接的(三次握手连接,四次挥手释放连接)
·TCP仅支持单播
·TCP是面向字节流的
·向上层提供面向连接的可靠传输服务(例如文件传输)
·TCP报文首部最小20字节,最大60字节
TCP流量控制
流量控制(flow control)让发送方的发送速率不要太快,让接收方来得及接收,利用滑动窗口机制可以很方便地在TCP连接上实现对发送方的流量控制。
·TCP接收方利用自己的几首窗口的大小来限制发送方发送窗口的大小
·TCP发送发收到接收方的零窗口通知后,应启动持续计时器。持续计时器超时后,向接收方发送零窗口探测报文。
TCP拥塞控制
在某段时间,若对网络中某一资源的需求超过了该资源所能提供的可用部分,网络性能就要变坏,这种情况叫拥塞(congestion)。如果对于拥塞不进行控制,整个网络的吞吐量将随输入负荷的增大而下降。TCP四种拥塞算法:慢开始(slow-start),拥塞避免(songestion avoidance),快重传(fast retransmit),快恢复(fast recovery)
·判断拥塞窗口cwnd的维护原则:只要没有网络拥塞,拥塞窗口就尽量大些,出现拥塞,窗口就小一些。
·判断出现拥塞的依据:没有按时收到确认报文
·发送方将拥塞窗口作为发送窗口swnd,swnd=cwnd
维护一个慢开始门限ssthresh状态变量:
(1)当cwnd<ssthresh时,使用慢开始算法
(2)当cwnd>ssthtesh时,停止使用慢开始算法而改用拥塞避免算法
相等时,都可以使用。
一开始使用慢开始算法,拥塞窗口指数比列增大,增大到慢开始门阀值时,停止使用慢开始算法,该规律加+1,当传输报文出现问题时,重传计时器超时时,网络很可能出现了拥塞:
(1)将ssthresh值更新为发生拥塞时cwnd值的一半;
(2)将cwnd值减少为1,并重新开始执行慢开始算法
有时,个别报文段会在网络中丢失,但实际上网络并没有拥塞,会导致发送方超时重传,并误认为网络发生了拥塞。降低了传输效率。
采用快重传可以让发送方尽早知道发生了个别报文段的丢失。快重传就是使发送方尽快重传,而不是等超时计时器超时再重传。
·要求接收方不要等待自己发送数据时才进行捎带确认,而是要立即发送确认。
·即使收到失序的报文段也要立即发出对已收到的报文段的重复确认。
·发送方一旦收到三个连续的重复确认,就将相应的报文段立即重传,而不是等该报文段的超时重传计时器超时再重传。
发送方一旦收到3个重复确认,就知道现在只是丢失了个别的报文段。于是不启动慢开始算法,而执行快恢复算法。
整体流程
超时重传时间的选择
针对出现超时重传时无法测准往返时间RTT的问题,Karn提出了一个算法:在计算加权平均往返时间RTTs时,只要报文段重传了,就不采用其往返时间RTT样本。也就是出现重传时,不计算RTTs,进而超时重传时间RTO也不会重新计算。报文段每重传一次,就把超时重传时间RTO增大一些。
TCP可靠传输的实现
TCP基于以字节为单位的滑动窗口来实现可靠传输
可以使用三个指针来描述发送窗口的状态。
虽然发送方的发送窗口是根据接收方的就诶和搜窗口设置的,但在同一时刻,发送方的发送窗口并不总是和接收方的窗口一样大。(网络传送窗口值需要经历一定的时间滞后,并且这个时间是不确定的,发送方还可以根据网络拥塞状况是大哥减小自己的发送窗口)
TCP通常对不按序到达的数据是先临时存放在接收窗口中,等到字节流中多缺少的字节收到后,再按序交付上层的应用进程。
TCP要求接收方必须有累积确认和捎带确认机制,这样可以减小传输开销。接收方可以在何时的时候发送确认,也可以在自己有数据要发送时把确认信息顺便带上。(接收方不应过分推迟发送确认,否则会导致发送方不必要的超时重传,会浪费网络资源)。
TCP的通信是全双工通信。通信中的每一方都在发送和接收报文段。因此。每一方都有自己的发送窗口和接收窗口。
TCP的运输连接管理
TCP连接的建立
TCP的连接建立主要解决以下三个问题:
(1)使TCP双方能够确知对方的存在。
(2)使TCP双方能够协商一些参数(如最大窗口值、是否使用窗口扩大选项和时间戳选项)
(3)使TCP双方能够对运输实体资源(如缓存大小、连接表中的项目等)进行分配。
使用“三报文握手”建立连接。
TCP的序号和确认号
32位序号 seq:Sequence number 缩写seq ,TCP通信过程中某一个传输方向上的字节流的每个字节的序号,通过这个来确认发送的数据有序,比如现在序列号为1000,发送了1000,下一个序列号就是2000。
32位确认号 ack:Acknowledge number 缩写ack,TCP对上一次seq序号做出的确认号,用来响应TCP报文段,给收到的TCP报文段的序号seq加1。
TCP的标志位
每个TCP段都有一个目的,这是借助于TCP标志位选项来确定的,允许发送方或接收方指定哪些标志应该被使用,以便段被另一端正确处理。
用的最广泛的标志是 SYN,ACK 和 FIN,用于建立连接,确认成功的段传输,最后终止连接。
·SYN:简写为S
,同步标志位,用于建立会话连接,同步序列号;
-
ACK: 简写为
.
,确认标志位,对已接收的数据包进行确认; - FIN: 简写为
F
,完成标志位,表示我已经没有数据要发送了,即将关闭连接; - PSH:简写为
P
,推送标志位,表示该数据包被对方接收后应立即交给上层应用,而不在缓冲区排队; - RST:简写为
R
,重置标志位,用于连接复位、拒绝错误和非法的数据包; - URG:简写为
U
,紧急标志位,表示数据包的紧急指针域有效,用来保证连接不被阻断,并督促中间设备尽快处理;
第一次握手:
客户端将TCP报文标志位SYN置为1,随机产生一个序号值seq=J,保存在TCP首部的序列号(Sequence Number)字段里,指明客户端打算连接的服务器的端口,并将该数据包发送给服务器端,发送完毕后,客户端进入SYN_SENT
状态,等待服务器端确认。
第二次握手:
服务器端收到数据包后由标志位SYN=1知道客户端请求建立连接,服务器端将TCP报文标志位SYN和ACK都置为1,ack=J+1,随机产生一个序号值seq=K,并将该数据包发送给客户端以确认连接请求,服务器端进入SYN_RCVD
状态。
第三次握手:
客户端收到确认后,检查ack是否为J+1,ACK是否为1,如果正确则将标志位ACK置为1,ack=K+1,并将该数据包发送给服务器端,服务器端检查ack是否为K+1,ACK是否为1,如果正确则连接建立成功,客户端和服务器端进入ESTABLISHED
状态,完成三次握手,随后客户端与服务器端之间可以开始传输数据了。
假设不采用“三次握手”,那么只要server发出确认,新的连接就建立了。由于现在client并没有发出建立连接的请求,因此不会理睬server的确认,也不会向server发送数据。但server却以为新的运输连接已经建立,并一直等待client发来数据。这样,server的很多资源就白白浪费掉了。采用三报文握手而不是二报文握手为了防止已经失效的连接请求报文突然又传送到TCP服务器,因为导致错误。
- 小写的ack代表的是头部的确认号Acknowledge number, 缩写ack,是对上一个包的序号进行确认的号,ack=seq+1。
- 大写的ACK,则是我们上面说的TCP首部的标志位,用于标志的TCP包是否对上一个包进行了确认操作,如果确认了,则把ACK标志位设置成1。
TCP的连接释放
- 第一次挥手: Client端发起挥手请求,向Server端发送标志位是FIN报文段,设置序列号seq,此时,Client端进入
FIN_WAIT_1
状态,这表示Client端没有数据要发送给Server端了。 - 第二次挥手:Server端收到了Client端发送的FIN报文段,向Client端返回一个标志位是ACK的报文段,ack设为seq加1,Client端进入
FIN_WAIT_2
状态,Server端告诉Client端,我确认并同意你的关闭请求。 - 第三次挥手: Server端向Client端发送标志位是FIN的报文段,请求关闭连接,同时Server端进入
LAST_ACK
状态。 - 第四次挥手 : Client端收到Server端发送的FIN报文段,向Server端发送标志位是ACK的报文段,然后Client端进入
TIME_WAIT
状态。Server端收到Client端的ACK报文段以后,就关闭连接。此时,Client端等待2MSL的时间后依然没有收到回复,则证明Server端已正常关闭,那好,Client端也可以关闭连接了。
为什么连接的时候是三次握手,关闭的时候却是四次握手?
建立连接时因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。所以建立连接只需要三次握手。
由于TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议,TCP是全双工模式。
这就意味着,关闭连接时,当Client端发出FIN报文段时,只是表示Client端告诉Server端数据已经发送完毕了。当Server端收到FIN报文并返回ACK报文段,表示它已经知道Client端没有数据发送了,但是Server端还是可以发送数据到Client端的,所以Server很可能并不会立即关闭SOCKET,直到Server端把数据也发送完毕。
当Server端也发送了FIN报文段时,这个时候就表示Server端也没有数据要发送了,就会告诉Client端,我也没有数据要发送了,之后彼此就会愉快的中断这次TCP连接。
TCP报文段的首部格式
源端口:占16比特,写入源端口号,用来标识发送该TCP报文段的应用进程。
目的端口:占16比特,写入目的端口号,用来标识接收该TCP报文段的应用进程。
序号字段:占32比特,序号增加到最后一个后,下一个序号就又回到了0.(指出本TCP报文段数据载荷的第一个字节的序号)。
确认号字段:占32比特,确认号增加到最后一个后,下一个确认号就又回到0。(指出期望收到对方下一个TCP报文段的数据载荷的第一个字节的序号,同时也是对之前收到的所有数据的确认。)
确认标志位置ACK:取值为1时确认号字段才有效;取值为0时确认号字段无效。(TCP规定,在连接建立后所有传送的TCP报文段都必须把ACK置1)
数据偏移字段:占4比特,并以字节为单位(指出TCP报文段的数据载荷部分的起始处距离TCP报文段的起始处有多远,实际上指出了TCP报文段的首部长度)
窗口字段:占16比特,以字节为单位。(指出发送本报文段的一方的接收窗口,窗口值作为接收方让发送方设置其发送窗口的依据,以接收方的接收能力来控制发送方的发送能力,称为流量控制)
校验和:占16比特,检查范围包括TCP报文段的首部数据载荷两部分。
同步标志位SYN:在TCP连接建立时用来同步序号
终止标志位FIN:用来释放TCP连接
复位标志位RST:用来复位TCP连接(当RST=1时,表明TCP连接出现了异常,必须释放连接,然后再重新建立连接)
推送标志位PSH:接收方的TCP收到该标志位为1的报文段会尽快上交应用进程。
·最大报文段长度MSS选项:TCP报文段数据载荷部分的最大长度。
·窗口扩大选项:为了扩大窗口
·时间戳选项:
(1)用来计算往返时间RTT
(2)用来处理序号超范围的情况,又称为防止序号绕回PAWS。