当前位置: 首页 > article >正文

Linux内核以太网驱动分析

1.网络接口卡接收和发送数据在Linux内核中的处理流程如下:

1. 网络接口卡(Network Interface Card, NIC)

  • 作用:负责物理层的数据传输,将数据包从网络介质(如以太网线)读取到内存中,或者将内存中的数据包发送到网络介质上。
  • 过程
    • 接收数据包:当NIC接收到数据包时,它会触发一个中断(ei_interrupt),通知内核有数据包到达。
    • 发送数据包:当NIC需要发送数据包时,它会从内存中读取数据包并通过网络介质发送出去。

2. 中断处理(ei_interrupt

  • 作用:处理NIC触发的中断,将接收到的数据包传递给内核协议栈。
  • 过程
    • 当NIC接收到数据包时,会触发ei_interrupt中断处理程序。
    • 中断处理程序会将数据包封装成一个SKB(Socket Buffer),并将其传递给内核协议栈进行进一步处理。

3. Socket Buffer(SKB)

  • 作用SKB是Linux内核中用于存储网络数据包的数据结构,它包含了数据包的头部信息和数据内容。
  • 过程
    • 在接收数据包时,ei_interrupt会将数据包封装成SKB
    • 在发送数据包时,ei_start_xmit会从SKB中读取数据包并传递给NIC进行发送。

4. 内核协议栈(Kernel Protocol Stack)

  • 作用:负责处理网络协议(如TCP/IP),对数据包进行解析、封装和转发。
  • 过程
    • 接收数据包:从SKB中读取数据包,进行协议解析和处理,然后将数据传递给用户空间的应用程序。
    • 发送数据包:从用户空间的应用程序接收数据,进行协议封装,然后将数据包封装成SKB并传递给NIC进行发送。

5. 用户空间应用程序(User Space Application)

  • 作用:运行在用户空间的应用程序,与网络进行交互。
  • 过程
    • 接收数据包:从内核协议栈接收数据包,进行应用层处理。
    • 发送数据包:将数据传递给内核协议栈,进行网络传输。

6. ei_start_xmit

  • 作用:负责将数据包从内核协议栈传递给NIC进行发送。
  • 过程
    • 当内核协议栈需要发送数据包时,会调用ei_start_xmit函数。
    • ei_start_xmit会从SKB中读取数据包,并将其传递给NIC进行发送。

7. net_devicehard_start_xmit

  • 作用net_device是Linux内核中表示网络设备的数据结构,hard_start_xmitnet_device中的一个函数指针,用于实际的数据包发送操作。
  • 过程
    • ei_start_xmit需要发送数据包时,会调用net_device中的hard_start_xmit函数。
    • hard_start_xmit会将数据包传递给NIC进行实际的发送操作。

        Linux内核直接把中断分成了两个部分:中断上半部和中断下半部。 

在Linux内核中,中断处理被分为两个部分:中断上半部(Top Half)和中断下半部(Bottom Half)。这种设计的主要目的是为了提高系统的响应速度和效率,避免在中断处理过程中长时间占用CPU,导致其他任务无法执行。下面是对这两个部分的详细讲解:

1. 中断上半部(Top Half)

  • 作用:处理中断的紧急部分,确保系统的实时性和响应速度。
  • 特点
    • 优先级高:中断上半部的优先级非常高,可以立即抢占其他任务的执行。
    • 执行时间短:中断上半部的执行时间非常短,通常只进行一些简单的操作,如保存现场、读取硬件状态等。
    • 不能睡眠:中断上半部不能执行任何可能引起睡眠的操作,如等待I/O完成、申请内存等。
  • 过程
    • 当硬件设备(如网络接口卡)触发中断时,CPU会立即停止当前任务的执行,转而执行中断上半部的处理程序。
    • 中断上半部会进行一些紧急的操作,如保存现场、读取硬件状态、记录中断信息等。
    • 完成紧急操作后,中断上半部会立即返回,继续执行被中断的任务。

2. 中断下半部(Bottom Half)

  • 作用:处理中断的非紧急部分,完成中断的后续处理工作。
  • 特点
    • 优先级低:中断下半部的优先级较低,不会立即抢占其他任务的执行。
    • 执行时间长:中断下半部的执行时间较长,可以进行一些复杂的操作,如数据处理、内存申请等。
    • 可以睡眠:中断下半部可以执行可能引起睡眠的操作,如等待I/O完成、申请内存等。
  • 过程
    • 中断上半部在完成紧急操作后,会将一些后续处理工作交给中断下半部。
    • 中断下半部会在适当的时候(如当前任务执行完毕、系统空闲时)被调度执行。
    • 中断下半部会进行一些复杂的操作,如数据处理、内存申请等,完成中断的后续处理工作。

2.Linux内核网络设备驱动框架分为四个模块,分别为网络协议接口模块、网络设备接口模块、设备驱动功能模块、网络设备与媒介模块。

1. 网络协议接口模块
  • dev_queue_xmit(): 这个函数负责将数据包从协议层传递到设备层。它会调用设备驱动程序的发送函数,将数据包放入设备的发送队列中。
  • netif_rx(): 这个函数负责将数据包从设备层传递到协议层。它通常在中断处理程序中被调用,将接收到的数据包传递给协议栈进行处理。
2. 网络设备接口模块
  • net_device结构体类型: 这是Linux内核中表示网络设备的数据结构。它包含了设备的各种属性和方法,如设备名、硬件地址、发送和接收函数等。这个结构体是连接协议层和设备层的关键。
3. 网络驱动功能模块
  • hard_start_xmit(): 这是设备驱动程序中的发送函数。它负责将数据包从设备的发送队列中取出,并将其发送到物理设备上。
  • 中断处理: 当物理设备接收到数据包时,会产生中断。中断处理程序会调用netif_rx()函数,将接收到的数据包传递给协议栈进行处理。
4. 网络设备与媒介模块
  • 网络物理设备: 这是实际的网络硬件设备,如网卡、无线网卡等。它负责将数据包转换为电信号或无线信号,并通过物理媒介(如网线、无线信号)进行传输。

3.网络协议接口模块:

        主要功能给上层协议提供透明的数据包发送和接收的接口,dev_queue_xmit()用于发送数据包,netif_rx()/netif_recieve_skb()用于接收数据包。不管是发送还是接收数据包都会使用到sk_buff结构体类型(套接字缓冲区),主要用在网络子系统中别的各层之间传输数据。

1. 数据包发送接口 dev_queue_xmit

功能与原型
  • 功能:将构造好的数据包(sk_buff)加入发送队列,最终由底层驱动通过ndo_start_xmit方法发送。
  • 原型
  int dev_queue_xmit(struct sk_buff *skb);
  • 参数:skb为包含待发送数据的缓冲区指针。
  • 返回值:0表示成功加入队列,负值表示失败。
使用步骤
  1. 构造sk_buff:需填充协议头(如IP、TCP/UDP)和数据内容,并关联网络设备(skb->dev)。
  2. 调用发送接口
   struct sk_buff *skb = alloc_skb(len, GFP_ATOMIC);
   // 填充skb数据(如通过skb_put、skb_push等)
   skb->dev = dev; // 关联网络设备
   int ret = dev_queue_xmit(skb);
   if (ret < 0) {
       // 错误处理(如释放skb)
   }
  • 注意dev_queue_xmit最终调用驱动实现的ndo_start_xmit函数完成实际发送。

2. 数据包接收接口 netif_rx

功能与原型
  • 功能:将底层驱动接收到的数据包(sk_buff)提交给协议栈处理。
  • 原型
  int netif_rx(struct sk_buff *skb);
  • 参数:skb为包含接收数据的缓冲区指针。
  • 返回值:表示接收队列状态(如NET_RX_SUCCESSNET_RX_DROP)。
使用步骤
  1. 分配并填充sk_buff
   struct sk_buff *skb = dev_alloc_skb(len + 2); // 分配缓冲区
   if (!skb) {
       // 内存不足处理
       return;
   }
   skb_reserve(skb, 2);    // 预留协议头空间
   // 从硬件读取数据到skb->data
   skb_put(skb, len);       // 设置数据长度
   skb->protocol = eth_type_trans(skb, dev); // 设置协议类型(如ETH_P_IP)[[15, 18]]
  1. 提交到协议栈
   int result = netif_rx(skb);
   if (result == NET_RX_DROP) {
       // 数据包被丢弃处理
   }
  • 注意:调用netif_rx后,驱动不可再访问skb,协议栈会接管其生命周期。

功能和作用

  1. 数据包封装与解封装sk_buff 结构体用于封装和解封装网络数据包,包括各种网络协议头(如MAC头、网络层头、传输层头等)。
  2. 数据包传输:在网络栈中,数据包在不同层之间传递时,sk_buff 结构体作为数据包的载体,确保数据包在传输过程中的完整性和一致性。
  3. 数据包管理sk_buff 结构体还包含了数据包的长度、引用计数、缓存区管理等信息,用于数据包的管理和调度。
  4. 网络协议处理:在数据包的发送和接收过程中,sk_buff 结构体用于存储和处理各种网络协议相关的数据和状态信息 

1. alloc_skb

功能

alloc_skb 是一个用于分配网络缓冲区(sk_buff)的函数。它是一个方便的封装函数,用于简化 _alloc_skb 的调用。alloc_skb 会根据指定的大小和优先级分配一个 sk_buff 结构体。

参数
  • size: 需要分配的缓冲区大小。
  • priority: 分配掩码,用于指定分配的优先级。
使用案例
#include <linux/skbuff.h>

static inline struct sk_buff *alloc_skb(unsigned int size, gfp_t priority)
{
    return __alloc_skb(size, priority, 0, NUMA_NO_NODE);
}

// 使用示例
struct sk_buff *skb = alloc_skb(1024, GFP_ATOMIC);
if (skb) {
    // 成功分配了缓冲区,可以进行后续操作
    // ...
    kfree_skb(skb); // 使用完毕后释放缓冲区
}

2. dev_alloc_skb

功能

dev_alloc_skb 是一个用于分配网络设备缓冲区的函数。它是一个遗留的辅助函数,用于简化 netdev_alloc_skb 的调用。

参数
  • length: 需要分配的缓冲区长度。
使用案例
#include <linux/skbuff.h>

static inline struct sk_buff *dev_alloc_skb(unsigned int length)
{
    return netdev_alloc_skb(NULL, length);
}

// 使用示例
struct sk_buff *skb = dev_alloc_skb(1024);
if (skb) {
    // 成功分配了缓冲区,可以进行后续操作
    // ...
    kfree_skb(skb); // 使用完毕后释放缓冲区
}

3. netdev_alloc_skb

功能

netdev_alloc_skb 是一个用于分配网络设备缓冲区的函数。它根据指定的网络设备和长度分配一个 sk_buff 结构体。

参数
  • dev: 指定的网络设备。
  • length: 需要分配的缓冲区长度。
使用案例
#include <linux/skbuff.h>

static inline struct sk_buff *netdev_alloc_skb(struct net_device *dev, unsigned int length)
{
    return netdev_alloc_skb(dev, length, GFP_ATOMIC);
}

// 使用示例
struct net_device *dev = ...; // 获取网络设备
struct sk_buff *skb = netdev_alloc_skb(dev, 1024);
if (skb) {
    // 成功分配了缓冲区,可以进行后续操作
    // ...
    kfree_skb(skb); // 使用完毕后释放缓冲区
}

4. struct net_device

功能

struct net_device 是一个用于描述网络设备的结构体。它包含了网络设备的各种属性和配置信息。

字段
  • name: 网络设备的名称。
  • name_node: 网络设备名称节点。
  • ifalias: 网络设备的别名。
  • mem_end: 共享内存的结束地址。
  • mem_start: 共享内存的起始地址。
  • base_addr: 基地址。
  • irq: 中断号。
使用案例
#include <linux/netdevice.h>

// 使用示例
struct net_device *dev = ...; // 获取网络设备

// 打印网络设备的名称
printk(KERN_INFO "Network device name: %s\n", dev->name);

// 打印网络设备的中断号
printk(KERN_INFO "Network device IRQ: %d\n", dev->irq);

5.NAPI 结构体的整体功能

napi_struct结构体是Linux内核中用于网络设备驱动程序的一种机制,旨在优化网络数据包的处理。它的主要功能包括:

  1. 减少中断处理频率:通过将数据包处理从中断上下文转移到轮询上下文,减少中断处理的频率,从而提高系统的性能。
  2. 权重控制:通过设置权重值,控制在一次轮询中可以处理的数据包数量,确保系统资源的合理分配。
  3. 轮询机制:提供一个轮询函数,用于在轮询上下文中处理数据包,避免在中断上下文中进行大量数据包处理。

NAPI 数据包信息的循环流程如下:

  1. 数据接收中断发生:当网络设备接收到数据包时,触发数据接收中断。
  2. 减半接收中断:通过NAPI机制,减少接收中断的频率,将数据包处理转移到轮询上下文。
  3. 以轮询试接收所有数据包或轮询权重耗尽:在轮询上下文中,通过轮询函数处理数据包,直到处理完所有数据包或达到权重限制。
  4. 开启接收中断:当轮询处理完成后,重新开启接收中断,等待下一次数据接收中断的发生。
#include <linux/netdevice.h>
#include <linux/napi.h>

struct my_net_device {
    struct net_device *netdev;
    struct napi_struct napi;
};

static int my_poll(struct napi_struct *napi, int budget)
{
    struct my_net_device *priv = container_of(napi, struct my_net_device, napi);
    int work_done = 0;

    // 处理数据包
    while (work_done < budget) {
        // 从硬件中读取数据包
        struct sk_buff *skb = my_read_skb_from_hardware();

        if (!skb)
            break;

        // 将数据包传递给上层协议栈
        netif_receive_skb(skb);

        work_done++;
    }

    if (work_done < budget) {
        // 如果处理的数据包数量小于预算值,就停止轮询
        napi_complete_done(napi, work_done);
    }

    return work_done;
}

static irqreturn_t my_irq_handler(int irq, void *dev_id)
{
    struct my_net_device *priv = dev_id;

    // 触发轮询
    napi_schedule(&priv->napi);

    return IRQ_HANDLED;
}

static int my_netdev_open(struct net_device *netdev)
{
    struct my_net_device *priv = netdev_priv(netdev);

    // 初始化napi_struct
    netif_napi_add(netdev, &priv->napi, my_poll, 64);

    // 启用中断
    enable_irq(netdev->irq);

    return 0;
}

static int my_netdev_close(struct net_device *netdev)
{
    struct my_net_device *priv = netdev_priv(netdev);

    // 禁用中断
    disable_irq(netdev->irq);

    // 删除napi_struct
    netif_napi_del(&priv->napi);

    return 0;
}


http://www.kler.cn/a/569826.html

相关文章:

  • ollama和open-webui部署ds
  • C++11特性(笔记二lambda,function)
  • VMware Ubuntu 共享目录
  • PDF文档中图片解析
  • 橙心同步助手更新,,支持博客园、头条和语雀
  • 不用写代码,批量下载今日头条文章导出excel和pdf
  • 傅里叶分析
  • 如何使用ArcGIS Pro制作横向图例:详细步骤与实践指南
  • 介绍如何使用生成对抗网络(GAN)和Cycle GAN设计用于水果识别的模型
  • ES 删除index 的curl
  • Vue.js 组件开发指南:实现、传值与优缺点分析
  • 性能优化——cache与cacheline
  • 如何远程访问svn中的URL
  • 数据结构(初阶)(六)----队列
  • ctfshow刷题笔记—栈溢出—pwn61~pwn64
  • C++类和对象:匿名对象及连续构造拷贝编译器的优化
  • Vscode通过Roo Cline接入Deepseek
  • 授权与认证之jwt(三)刷新令牌该如何设计
  • 计算机网络学习————(五)TCP/IP学习
  • ubuntu Linux 正确设置中文环境的方法