当前位置: 首页 > article >正文

【网络原理】Udp报文结构,保姆级详解,建议收藏

 💐个人主页:初晴~

📚相关专栏:计算机网络那些事


一、UDP报文格式

可以看出UDP报文主要由报头正文两部分构成,报头存储了此次报文的一些重要信息,而正文才是真正需要传输的内容。本篇文章就主要来介绍一下UDP报头的组成与作用了。

二、UDP报头的结构与作用

我们可以看到报头又被分为了源端口目的端口长度校验和四个部分,每个部分各占 16 个比特也就是 2 个字节,故UDP报头的总长度就为固定8 个字节

注意:

UDP报头的各字段的长度与作用是规定好的,我们作为普通程序员是没有权限修改的,换句话说,我们就算单方面修改了协议,由于其他人遵守的是官方协议,将会导致我们写的报文无法被其它人正确解读。因此,为了能正常地传输与解读数据,这里的这些协议细节我们一定要严格遵守

接下来我们就来深入解读一下这几个字段的作用与注意事项吧:

(1)源端口与目的端口

在网络通讯中,涉及到四个关键信息:

源IP、目的IP

源端口、目的端口

类比于寄快递时,一个快递单上也至少需要四个关键信息:

发件人地址、收件人地址

发件人电话、收件人电话

简单来说,这几个参数就像是网络通信中的“快递单”,起到了一个定位的作用,在庞大的互联网中确定了此次通信中的起始地目的地

在同一时刻,一个主机中的某一端口号只会映射一个进程,因此就可以通过端口号定位到对应的服务端/客户端的进程了。

值得注意的是一个端口号的长度为16比特(bit),也就是2个字节(byte),因此报头中的 源端口 与 目的端口 直接记录对应的端口号即可,不需要做过多的处理

(2)报文长度

报文长度=报头长度+载荷(正文)长度

它就是用来记录此次报文的总长度,让程序根据长度来对报文进行划分,进而能够正确地进行解读。

不过,值得注意的是,这里存储报文长度的空间只有2个字节,什么概念呢?就是代表整个报文的长度最多也只有64KB

这主要还是历史遗留性问题。UDP协议是在30多年前提出的,在当时,64KB已经是一个非常大的数据量了。不过那时候的开发者肯定想象不到在短短30年后的今天,随便拍张照片都是MB级别的了,64KB就完全不够看得了。

但如果我们就是要传输一个很大的数据该怎么办呢?

有两种方案:

<1>方案一

将一个大的数据包拆分成多个小的,再分别进行传输,接收方再通过组包最终获取到数据

但这个方案实施起来将会非常复杂。首先,数据的拆分与组合本身就十分复杂,再加上网络传输过程中充满了不确定性,数据包到达的先后顺序,甚至数据包是否能到达(丢包问题)都是无法确定的,这会导致接收方的组包操作将会变的异常复杂,就算真的可以处理,消耗的时间也是非常长的,这对于“时间就是金钱”的网络传输是十分致命的。

因此,我们一般不会采用这个方案

<2>方案二

选用别的适合传输大数据量的协议,比如大名鼎鼎的TCP协议

TCP协议对于长度没有任何限制,并且还带有可靠传输等机制,保障了传输的稳定性,通信质量也比较高。

小结

UDP报文的可传输的最大数据量比较小,实在要传输大量的数据时还是采用TCP协议比较合适

(3)校验和

因为网络传输主要是通过 电信号/光信号/电磁波 来传播的,而这些信号很容易会受到外界环境干扰,导致传输的数据发生改变,使最终结果出现错误。

举个例子:我要去超市买苹果、土豆、鸡蛋、番茄 4 样物品,这时,就用 4 来当做“校验和”,购物结束后,数一下实际购物数,与校验和进行比较,若相等,则任务此次购物时正确的,否则则认为此次购物出现错误

不过这里主要就是为了让大家知道什么是校验和。事实上这种算法比较草率,没法确定购买物品的准确性当我购买的其它物品种类为 4 时,仍然会认为这次购买是正确的。为了更准确的判断,就需要更加严谨的 检查策略和算法

下图就为UDP数据校验的检查过程:

上述这种校验方法被称之为CRC检验方法。通过对前后两次数据分别计算校验和,接着通过比较校验和来判断两次数据是否一致,如果不相同,则会直接对数据进行丢弃

由于这种机制,发送方无法得知接收方是否成功接收数据,也就无法进行数据重发等补救机制,这会导致接收方可能会出现数据丢失数据接收不完整,从而导致最终数据解析出现问题。因此,我们一般认为 UDP 是一种不可靠传输

  • 有人可能会问,记录校验和的空间只有 2 个字节,万一校验和太长了怎么办?
  • 事实上不必担心这一问题,就算校验和过大,发生溢出,也不会影响“相等性判断”,我们只需要判断两次校验和是否相等即可,相等的值溢出后仍会保持相等,因此这并不会影响我们的判断。我们也并不关注校验和的具体指是多少。

那么,在计算校验和的过程中,是否可能会出现两个不同的数据,生成的校验和相同呢?

这的确可能发生,不过概率是非常低的。不过对于CRC算法来说,这个概率相对还比较高

除了CRC算法,还可能会用到其它一些算法来计算校验和,比如两个经典算法 MD5 SHA1

<1>MD5

MD5算法, 本质上可以理解为 字符串Hash算法

背后的实现过程是一个 “数学过程” , 可以理解为 套公式 

不过具体的计算细节就不是我们需要关注的了,我们更需要关心它的特点

1、定长: 无论输入的字符串 长度是多少 , 得到的 MD5 都是固定长度 的

2、分散性: 对于不同的字符串, 即使字符串中只改变了一点点, 得到的 MD5 差异都是很大的

我们知道,数据越分散,越有利于建哈希表,越不容易发生哈希冲突。因此,MD5 算法适合用来做哈希算法

3、不可逆性: 根据输入内容计算 MD5值 是非常容易的,但已知 MD5 值想还原出原始内容就几乎无法实现了

因此MD5 算法适合做加密算法

<2>SHA1

SHA1算法与MD5是十分类似的,也具有以上三个特点,博主这里就不做过多赘述了


总结

UDP报头结构

  1. 源端口(Source Port):16位,标识发送方的应用程序端口号
  2. 目的端口(Destination Port):16位,标识接收方的应用程序端口号
  3. 长度(Length):16位,表示整个UDP数据报的长度,包括头部和数据部分。
  4. 校验和(Checksum):16位,用于检测数据报在传输过程中是否发生了损坏。此字段在某些情况下(如IPv4中)可能是可选的。

UDP报文的使用场景

  1. 实时多媒体传输:由于UDP无需建立连接,发送速度快,适用于语音、视频等实时传输。
  2. 广播或多播通信:UDP支持向多个接收者同时发送数据,适用于广播或多播应用。
  3. 简单服务查询:如DNS查询等,要求快速响应,但对数据准确性要求不高。
  4. 游戏:在线游戏中,为了保证玩家体验,通常使用UDP进行实时数据传输。

那么本篇文章就到此为止了,如果觉得这篇文章对你有帮助的话,可以点一下关注和点赞来支持作者哦。如果有什么讲的不对的地方欢迎在评论区指出,希望能够和你们一起进步✊


http://www.kler.cn/a/330921.html

相关文章:

  • DuckDB:PRAGMA语句动态配置数据库行为
  • 机器学习免费使用的数据集及网站链接
  • Windows 系统中的任务管理器是什么,打开快捷键是什么?
  • [项目实战2]贪吃蛇游戏
  • Android Telephony | 协议测试针对 test SIM attach network 的问题解决(3GPP TS 36523-1-i60)
  • css中的部分文字特性
  • 27 Vue3之unocss原子化
  • Spring Boot 3.x 集成 Feign
  • 浙大数据结构:06-图3 六度空间
  • C0010.Qt5.15.2下载及安装方法
  • 网络安全的详细学习顺序
  • SFTP 是什么?如何在 Linux 终端上访问 SFTP
  • 在Linux系统安装Nginx
  • 【AI知识点】损失函数(Loss Function)
  • 什么是 HTTP 请求的 X-Forwarded-Proto 字段
  • (作业)第三期书生·浦语大模型实战营(十一卷王场)--书生入门岛通关第1关Linux 基础知识
  • 进度条(倒计时)Linux
  • Jenkins从入门到精通,构建高效自动化流程
  • 从0-1搭建海外社媒矩阵,详细方案深度拆解
  • 网络原理-数据链路层
  • C++学习,STL
  • 一文上手SpringSecuirty【六】
  • Linux·进程概念(下)
  • 适配器模式【对象适配器模式和类适配器模式,以及具体使用场景】
  • 测试-----BUG篇
  • 仿函数和函数指针介绍