当前位置: 首页 > article >正文

线性可分支持向量机的原理推导 9-23拉格朗日乘子α的最大化问题 公式解析

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-23 是支持向量机(SVM)优化过程中从最大化问题对偶问题的关键步骤之一。它将目标函数简化为关于拉格朗日乘子 α \alpha α 的最大化问题,并附加了一些重要的约束条件。我们将详细解释公式 9-23 的各个部分,包括目标函数和约束条件。

公式 9-23 的具体形式

公式 9-23 可以分为三行:

  1. 目标函数
    max ⁡ α 1 2 ∑ i = 1 N ∑ j = 1 N α i α j y i y j ( x i ⋅ x j ) − ∑ i = 1 N α i \max_{\alpha} \quad \frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_i \alpha_j y_i y_j (\mathbf{x}_i \cdot \mathbf{x}_j) - \sum_{i=1}^{N} \alpha_i αmax21i=1Nj=1Nαiαjyiyj(xixj)i=1Nαi

  2. 约束条件 1
    ∑ i = 1 N α i y i = 0 \sum_{i=1}^{N} \alpha_i y_i = 0 i=1Nαiyi=0

  3. 约束条件 2
    α i ≥ 0 , i = 1 , 2 , … , N \alpha_i \geq 0, \quad i = 1, 2, \dots, N αi0,i=1,2,,N

现在,我们逐步解释公式 9-23。

1. 目标函数解释

原始目标:

首先,回顾原始问题,支持向量机的优化问题是通过最小化法向量 w \mathbf{w} w 的二次范数 1 2 ∥ w ∥ 2 \frac{1}{2} \|\mathbf{w}\|^2 21w2,同时满足分类约束条件:
y i ( w T x i + b ) ≥ 1 , i = 1 , 2 , … , N y_i (\mathbf{w}^T \mathbf{x}_i + b) \geq 1, \quad i = 1, 2, \dots, N yi(wTxi+b)1,i=1,2,,N

通过拉格朗日乘子法,优化问题被转换为一个关于拉格朗日乘子 α i \alpha_i αi 的对偶问题。

目标函数的推导过程:

回顾之前得到的公式 9-22,它是对偶问题的形式:
L ( α ) = − 1 2 ∑ i = 1 N ∑ j = 1 N α i α j y i y j ( x i ⋅ x j ) + ∑ i = 1 N α i L(\alpha) = -\frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_i \alpha_j y_i y_j (\mathbf{x}_i \cdot \mathbf{x}_j) + \sum_{i=1}^{N} \alpha_i L(α)=21i=1Nj=1Nαiαjyiyj(xixj)+i=1Nαi

在公式 9-23 中,我们进行最大化目标函数时,由于之前的公式是最小化的,我们将符号反转,从而得到新的目标函数:
max ⁡ α 1 2 ∑ i = 1 N ∑ j = 1 N α i α j y i y j ( x i ⋅ x j ) − ∑ i = 1 N α i \max_{\alpha} \quad \frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_i \alpha_j y_i y_j (\mathbf{x}_i \cdot \mathbf{x}_j) - \sum_{i=1}^{N} \alpha_i αmax21i=1Nj=1Nαiαjyiyj(xixj)i=1Nαi

这个目标函数具有两部分:

  • 第一部分: 1 2 ∑ i = 1 N ∑ j = 1 N α i α j y i y j ( x i ⋅ x j ) \frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_i \alpha_j y_i y_j (\mathbf{x}_i \cdot \mathbf{x}_j) 21i=1Nj=1Nαiαjyiyj(xixj)

    • 这是一个二次项,它描述了样本之间的相互作用,具体是通过拉格朗日乘子 α i α j \alpha_i \alpha_j αiαj、类别标签 y i y j y_i y_j yiyj、以及样本点的内积 ( x i ⋅ x j ) (\mathbf{x}_i \cdot \mathbf{x}_j) (xixj) 进行加权的。
    • 二次项通常出现在支持向量机优化问题中,它代表了支持向量之间的相互关系以及对决策边界的影响。
  • 第二部分: ∑ i = 1 N α i \sum_{i=1}^{N} \alpha_i i=1Nαi

    • 这是一个线性项,是所有拉格朗日乘子的加和。
    • 它的存在是为了调节整体优化过程,使得我们不会无限制地增加 α i \alpha_i αi 的值。
最大化问题的含义:
  • 最大化这个目标函数意味着我们希望找到最优的拉格朗日乘子 α i \alpha_i αi,使得目标函数达到最大值。
  • 在这个最大化过程中,只有那些 α i > 0 \alpha_i > 0 αi>0 的点(即支持向量)才对分类边界产生影响,其他 α i = 0 \alpha_i = 0 αi=0 的点不会对分类结果产生作用。

2. 约束条件解释

约束条件 1: ∑ i = 1 N α i y i = 0 \sum_{i=1}^{N} \alpha_i y_i = 0 i=1Nαiyi=0

这个约束条件表示拉格朗日乘子 α i \alpha_i αi 和类别标签 y i y_i yi 的加权和必须等于零。

原因:
  • 这个约束是从对 b b b 求导得到的结果(见公式 9-19)。
  • 它的物理意义是确保分类器的平衡,即在最优分类超平面上,正类样本和负类样本的权重达到某种平衡。
  • 通过这种平衡,我们确保超平面不会偏向任何一类,正类和负类的误分类率保持对称。
几何解释:

这个约束条件实际上反映了一个超平面平衡的问题。在支持向量机的优化过程中,正类和负类样本对分类器的贡献通过 α i \alpha_i αi y i y_i yi 的乘积来体现。当 ∑ i = 1 N α i y i = 0 \sum_{i=1}^{N} \alpha_i y_i = 0 i=1Nαiyi=0 时,正负类别对分类边界的影响处于平衡状态。

约束条件 2: α i ≥ 0 , i = 1 , 2 , … , N \alpha_i \geq 0, \quad i = 1, 2, \dots, N αi0,i=1,2,,N

这个条件要求每个拉格朗日乘子 α i \alpha_i αi 必须为非负值。

原因:
  • 根据拉格朗日乘子法的理论,对于不等式约束(即 y i ( w T x i + b ) ≥ 1 y_i (\mathbf{w}^T \mathbf{x}_i + b) \geq 1 yi(wTxi+b)1),拉格朗日乘子 α i \alpha_i αi 必须为非负。
  • α i = 0 \alpha_i = 0 αi=0 时,表示对应的样本点 x i \mathbf{x}_i xi 对超平面没有贡献,即这些点并不影响分类器的构建。
  • α i > 0 \alpha_i > 0 αi>0 时,表示对应的样本点 x i \mathbf{x}_i xi 是一个支持向量,对分类边界的构造起关键作用。
几何解释:

支持向量是那些距离分类超平面最近的样本点,它们对最终的分类边界产生了实际影响。这个约束确保了只有那些在超平面上或附近的样本点(即支持向量)才会对分类超平面有影响,而其他远离分类边界的样本点不会影响优化结果。

3. 公式 9-23 的整体意义

公式 9-23 的目标函数是通过拉格朗日乘子 α i \alpha_i αi 表示的对偶问题,目标是最大化一个与支持向量相关的函数,同时需要满足两个约束条件。这一过程是 SVM 中通过拉格朗日乘子法将原始问题(即最小化 ∥ w ∥ 2 \|\mathbf{w}\|^2 w2 的问题)转化为一个可以更高效求解的对偶问题。

  • 目标函数描述了支持向量之间的相互作用及其对分类边界的影响,最大化目标函数意味着找到最优的支持向量组合。
  • 第一个约束条件确保分类超平面的平衡,使得正负类样本对分类边界的影响保持均衡。
  • 第二个约束条件确保每个拉格朗日乘子 α i \alpha_i αi 非负,只有那些 α i > 0 \alpha_i > 0 αi>0 的样本点(即支持向量)才对最终的分类边界有影响。

总结

公式 9-23 是支持向量机优化的核心之一,通过最大化拉格朗日对偶问题中的目标函数并满足约束条件,我们可以找到支持向量并确定分类器的最优超平面。这个过程不仅有效地简化了原始问题的求解,还通过对偶问题的形式为进一步的扩展(如核方法)提供了基础。


http://www.kler.cn/news/362154.html

相关文章:

  • 蘑菇分类识别数据集(猫脸码客 第222期)
  • Linux文件的查找和打包以及压缩
  • 060_基于python智能旅游系统
  • 关于jmeter中没有jp@gc - response times over time
  • Netty无锁化设计之对象池实现
  • NewStarCTF2024-Week2-Misc-WP
  • Spring中导致事务传播失效的情况(自调用、方法访问权限、异常处理不当、传播类型选择错误等。在实际开发中,务必确保事务方法正确配置)
  • 回溯法求解简单组合优化问题
  • 初学者怎么入门大语言模型(LLM)?
  • 微积分复习笔记 Calculus Volume 1 - 3.5 Derivatives of Trigonometric Functions
  • 11.学生成绩管理系统(Java项目基于SpringBoot + Vue)
  • rk3568 , rk3588, rtl8211F , 时钟的问题
  • MySQL--mysql的安装
  • 什么是CI/CD
  • 主机本地IP与公网IP以及虚拟机的适配器和WSL发行版的IP
  • 分布式异步任务框架Celery,如何实现代码实时监控
  • 聊聊黑龙江等保测评
  • 人大金仓链接
  • rancher安装并快速部署k8s 管理集群工具
  • C/S 软件架构
  • D39【python 接口自动化学习】- python基础之函数
  • 线下陪玩导游系统软件源码,家政预约服务源码(h5+小程序+app)
  • JVM、字节码文件介绍
  • [ComfyUI]Flux:太酷啦!超震撼电影视觉盛宴!2025生肖灵蛇守护
  • 记一次Video-LLaMa部署过程
  • 【计算机网络 - 基础问题】每日 3 题(五十二)