当前位置: 首页 > article >正文

线性可分支持向量机的原理推导 9-26对拉格朗日函数L(w,b,α) 关于b求导 公式解析

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-26 的完整形式为:
∂ L ∂ b = − ∑ i = 1 N α i ∗ y i = 0 \frac{\partial L}{\partial b} = -\sum_{i=1}^{N} \alpha_i^* y_i = 0 bL=i=1Nαiyi=0

1. 公式的含义

这个公式表示的是支持向量机(SVM)优化问题中的站点条件之一,也就是最优性条件。具体来说,这是在拉格朗日函数 L ( w , b , α ) L(w, b, \alpha) L(w,b,α) 中对偏置项 b b b 求导后得到的条件,确保在最优点 b ∗ b^* b 处,偏导数为 0。

符号“*”表示这些变量是最优解:

  • α i ∗ \alpha_i^* αi 是最优拉格朗日乘子。
  • b ∗ b^* b 是最优的偏置(即超平面的截距)。

这个条件告诉我们,所有拉格朗日乘子 α i ∗ \alpha_i^* αi 和对应的样本标签 y i y_i yi 的加权和为 0。该条件是支持向量机在最优解处对偶问题的一个约束,确保最优超平面对所有样本点的影响保持平衡。

2. 公式的推导

从拉格朗日函数 L ( w , b , α ) L(w, b, \alpha) L(w,b,α) 开始:
L ( w , b , α ) = 1 2 ∥ w ∥ 2 − ∑ i = 1 N α i ( y i ( w T x i + b ) − 1 ) L(w, b, \alpha) = \frac{1}{2} \|w\|^2 - \sum_{i=1}^{N} \alpha_i \left( y_i (w^T x_i + b) - 1 \right) L(w,b,α)=21w2i=1Nαi(yi(wTxi+b)1)

在这个函数中, b b b 只出现在约束项 ∑ i = 1 N α i ( y i ( w T x i + b ) − 1 ) \sum_{i=1}^{N} \alpha_i \left( y_i (w^T x_i + b) - 1 \right) i=1Nαi(yi(wTxi+b)1) 中。

b b b 求导:

我们对 b b b 求偏导数:
∂ ∂ b ( − ∑ i = 1 N α i y i ( w T x i + b ) ) = − ∑ i = 1 N α i y i \frac{\partial}{\partial b} \left( - \sum_{i=1}^{N} \alpha_i y_i (w^T x_i + b) \right) = - \sum_{i=1}^{N} \alpha_i y_i b(i=1Nαiyi(wTxi+b))=i=1Nαiyi

设置偏导数为 0:

为了找到最优的 b ∗ b^* b,我们将偏导数设为 0:
− ∑ i = 1 N α i ∗ y i = 0 -\sum_{i=1}^{N} \alpha_i^* y_i = 0 i=1Nαiyi=0

于是得出公式 9-26:
∑ i = 1 N α i ∗ y i = 0 \sum_{i=1}^{N} \alpha_i^* y_i = 0 i=1Nαiyi=0

3. 公式的作用和意义

这个条件表达的是,所有最优拉格朗日乘子 α i ∗ \alpha_i^* αi 和对应的类别标签 y i y_i yi 的加权和为 0。它在支持向量机的优化问题中起到至关重要的平衡作用,确保正类样本和负类样本对分类器的贡献达到平衡。

  • 平衡性:该条件确保分类器的偏置 b ∗ b^* b 不会过度偏向正类或负类样本。在支持向量机的优化过程中,超平面必须保持对正负类样本的平衡,否则分类器可能会偏向一侧。

  • 对偶问题中的约束:在 SVM 对偶问题中,优化目标是通过拉格朗日乘子 α i ∗ \alpha_i^* αi 最大化问题,公式 9-26 作为一个附加的约束条件,确保解的可行性。

4. 几何解释

几何上,公式 9-26 表示正类和负类样本在构造分类超平面时的影响是平衡的。由于 α i ∗ \alpha_i^* αi 代表每个样本点的权重,而 y i y_i yi 表示类别(正类为 + 1 +1 +1,负类为 − 1 -1 1),这个条件确保分类超平面能够保持对称性:

  • 如果 ∑ i = 1 N α i ∗ y i ≠ 0 \sum_{i=1}^{N} \alpha_i^* y_i \neq 0 i=1Nαiyi=0,则分类超平面可能偏向某个类别,这会导致不对称的分类结果。
  • 通过 ∑ i = 1 N α i ∗ y i = 0 \sum_{i=1}^{N} \alpha_i^* y_i = 0 i=1Nαiyi=0,我们保证分类器保持平衡,既不过度偏向正类,也不过度偏向负类。

5. 在 SVM 中的作用

  • 优化约束条件:公式 9-26 是 SVM 优化中的约束条件之一,确保在拉格朗日乘子 α i ∗ \alpha_i^* αi 优化的过程中,解满足对偶问题的可行性,并且平衡正负类样本的影响。

  • 支持向量的贡献:由于只有 α i ∗ > 0 \alpha_i^* > 0 αi>0 的点是支持向量,公式 9-26 还决定了这些支持向量如何通过 α i ∗ \alpha_i^* αi 的权重对分类器的构造产生影响。

6. 公式的物理意义

  • 平衡正负类样本:正类和负类样本通过其拉格朗日乘子 α i ∗ \alpha_i^* αi 对超平面的构造产生影响,公式 9-26 保证了这两类样本的影响是平衡的,这使得分类超平面既不会偏向正类,也不会偏向负类。

  • 保证分类器的正确性:这个约束条件在优化过程中起到至关重要的作用。通过该条件,我们能够确保在最优条件下,分类器的偏置 b ∗ b^* b 是由所有支持向量(正类和负类)共同决定的。

7. 总结

公式 9-26 是 SVM 对偶问题中的一个关键约束条件,它确保所有最优拉格朗日乘子和类别标签的加权和为 0。这个条件在 SVM 的优化过程中有助于保持分类超平面的平衡性,确保分类器不会偏向任何一类样本。通过优化拉格朗日乘子 α i ∗ \alpha_i^* αi,并结合该约束条件,我们能够找到满足约束条件的最优分类超平面。


http://www.kler.cn/news/365031.html

相关文章:

  • 养狗为什么需要宠物空气净化器?宠物空气净化器排行榜公布!
  • 大家都在用的HR招聘管理工具:国内Top5排名
  • 数组类型应用举例
  • 如何使用 NumPy 和 Matplotlib 进行数据可视化
  • 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio
  • 微信小程序/uniapp动态修改tabBar信息及常见报错
  • AI应用程序低代码构建平台Langflow
  • 从一到无穷大 #37 Databricks Photon:打响 Spark Native Engine 第一枪
  • 打包方式-jar和war的区别
  • oracle数据库---PL/SQL、存储函数、存储过程、触发器、定时器job、备份
  • 做网站怎么做?
  • VSCode设置用鼠标滚轮控制字体大小
  • 安全见闻---清风
  • 记一次AWS服务器扩容
  • Lua数字
  • xtu oj 分段
  • ScrollView 真机微信小程序无法隐藏滚动条
  • 记一次js泄露pass获取核心业务
  • API接口开发系列文章:构建高效、安全、可扩展的服务
  • 测试必需要掌握的 Linux 操作系统知识笔记
  • ACL访问控制
  • MATLAB——入门知识
  • linux(ubuntu)部署GraphHopper-9.1
  • 基于RK3588/算能BM1684 AI盒子:综合视频智能AI分析系统建设方案(二)烟火检测、物品遗留、车道占用
  • RabbitMQ深层浅讲【通俗易懂】
  • 【代码随想录Day48】图论Part01