当前位置: 首页 > article >正文

线性可分支持向量机的原理推导 线性分隔超平面关于任意样本点 (x_i,y_i)的几何间隔 公式解析

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-3 进一步明确了如何计算分类间隔的大小,公式形式如下:
d i = y i w T x i + b ∥ w ∥ d_i = y_i \frac{\mathbf{w}^T \mathbf{x}_i + b}{\|\mathbf{w}\|} di=yiwwTxi+b

1. 公式 9-3 的含义

公式 9-3 表达的是样本点 ( x i , y i ) (\mathbf{x}_i, y_i) (xi,yi) 到超平面的距离 d i d_i di,具体地说,它给出了没有符号的距离,也就是样本点到分类超平面的几何间隔。几何间隔与之前公式 9-1 提到的带符号的距离不同,它只关注点到平面的绝对距离,不关心分类的正负方向。

含义拆解:
  • d i d_i di 是第 i i i 个样本点 x i \mathbf{x}_i xi 到超平面的几何间隔
  • y i y_i yi 是样本点的标签(+1 或 -1),这个标签在这里用来保证超平面两侧的点符号一致,起到方向性作用。
  • w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b 是样本点到超平面的距离函数(在分类函数中已经出现过),但这里表示为带符号的距离。
  • ∥ w ∥ \|\mathbf{w}\| w 是超平面的法向量 w \mathbf{w} w 的范数(即向量的长度),表示法向量的规模,用于标准化距离。

2. 几何间隔的推导

公式 9-3 是如何从之前的带符号距离(公式 9-1)推导出来的呢?

带符号距离(公式 9-1 回顾):

我们在公式 9-1 中定义了样本点的带符号距离:
d i = y i ( w T x i + b ) d_i = y_i (\mathbf{w}^T \mathbf{x}_i + b) di=yi(wTxi+b)

这个公式定义了样本点 x i \mathbf{x}_i xi 在分类函数中的值 w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b,并通过 y i y_i yi 来确保该距离的符号符合样本点的真实分类。

转换为几何间隔:

在公式 9-3 中,我们希望得到几何间隔,也就是样本点到超平面的实际物理距离。要做到这一点,我们需要考虑分类超平面的法向量的大小。

几何间隔的公式为:
d i = ∣ w T x i + b ∣ ∥ w ∥ d_i = \frac{| \mathbf{w}^T \mathbf{x}_i + b |}{\|\mathbf{w}\|} di=wwTxi+b

该公式表示距离是超平面法向量 w \mathbf{w} w 投影到样本点 x i \mathbf{x}_i xi 上的值,然后用法向量的大小 ∥ w ∥ \|\mathbf{w}\| w 进行归一化。

  • 为什么要归一化?:因为 w \mathbf{w} w 可以通过缩放变大或变小,而几何间隔应该与 w \mathbf{w} w 的缩放无关。通过除以 ∥ w ∥ \|\mathbf{w}\| w,我们消除了法向量的影响,使得这个公式只表示到超平面的实际距离。

通过加入 y i y_i yi,公式 9-3 确保了几何间隔的符号(用于分类方向一致性),并且引入了超平面的法向量归一化,得到了真实的几何间隔。

3. 公式 9-3 的作用

公式 9-3 明确了一个关键点:几何间隔是带符号的距离除以超平面法向量的大小。它揭示了样本点与超平面之间的实际物理距离,反映了分类的置信度。

几何间隔越大,意味着样本点离超平面越远,分类的置信度也就越高。因此,支持向量机的核心思想之一就是最大化最小几何间隔,确保最难分类的样本(即支持向量)与超平面有足够大的距离。

4. 几何间隔与法向量的关系

d i = y i w T x i + b ∥ w ∥ d_i = y_i \frac{\mathbf{w}^T \mathbf{x}_i + b}{\|\mathbf{w}\|} di=yiwwTxi+b

这个公式表明:

  • 几何间隔不仅与样本点的位置相关(通过 x i \mathbf{x}_i xi b b b),还与超平面的法向量大小 ∥ w ∥ \|\mathbf{w}\| w 有关。
  • 如果我们不除以 ∥ w ∥ \|\mathbf{w}\| w,那么法向量的缩放会直接影响带符号距离,使得距离不能准确反映样本与超平面之间的真实物理距离。因此,通过除以 ∥ w ∥ \|\mathbf{w}\| w 进行归一化,我们可以得到一个真正代表物理距离的几何间隔。

5. 总结

公式 9-3 给出了几何间隔的表达式,即每个样本点到分类超平面的真实距离。它是通过带符号距离归一化法向量大小得到的,反映了分类的置信度。支持向量机通过最大化这些几何间隔,确保超平面能够最大化区分不同类别的样本。


http://www.kler.cn/news/362311.html

相关文章:

  • 客户端工具xshell/finalshell连接Vagrant创建的虚拟机并上传本地文件
  • C++ [项目] 飞机大战
  • Docker基础部署
  • 数据库表的创建
  • 用.NET开发跨平台应用程序采用 Avalonia 与MAUI如何选择
  • AutoSar AP CM实例说明符的使用方法总结
  • 数据结构与算法:高级数据结构与实际应用
  • <el-input-number> 回车自动失去焦点
  • 如何在Python网络爬虫中处理动态网页?
  • rootless模式下istio ambient鉴权策略
  • Oracle分区表改造(二):通过在线重定义改造为分区表
  • 几何算法系列:空间实体体积计算公式推导
  • Rust : FnOnce、线程池与多策略执行
  • 11.useComponentDidMount
  • neo4j 中日期时间 时间戳处理
  • Android状态栏/通知栏图标白底问题
  • 归并排序 - 非递归实现
  • 代码随想录刷题Day8
  • 基于SSM汽车零部件加工系统的设计
  • bindService 流程学习总结
  • PTA L1系列题解(C语言)(L1_089 -- L1_096)
  • JZ2440开发板——MMU与Cache
  • 如何使用Git推送本地搭建的仓库以及远程克隆的仓库
  • golang中的上下文
  • 滚雪球学Redis[7.4讲]:Redis在分布式系统中的应用:微服务与跨数据中心策略
  • 016_基于python+django网络爬虫及数据分析可视化系统2024_kyz52ks2