当前位置: 首页 > article >正文

神经网络章节感知机部分 空间中任意一点到线性分割超平面的距离公式 解释说明

公式 8-3 的内容如下:
1 ∣ ∣ w ∣ ∣ ∣ w ⋅ x 0 + b ∣ \frac{1}{||w||} |w \cdot x_0 + b| ∣∣w∣∣1wx0+b

公式 8-3 的详细解释:

这个公式表示某个点 x 0 x_0 x0 到一个超平面的距离,其中:

  • w w w 是感知机的权重向量。
  • b b b 是感知机的偏置项(或阈值)。
  • x 0 x_0 x0 是你要计算到超平面距离的点。
  • ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣ 表示权重向量 w w w 的 L2 范数,即 w w w 的长度(欧几里得长度)。
  • w ⋅ x 0 w \cdot x_0 wx0 表示向量 w w w 和点 x 0 x_0 x0 的点积。

公式的形式是通过点积 w ⋅ x 0 + b w \cdot x_0 + b wx0+b 表示 x 0 x_0 x0 点相对于超平面的位置,然后通过除以权重向量 w w w 的 L2 范数来标准化,这样得到的就是该点到超平面的垂直距离

解释步骤:

  1. w ⋅ x 0 + b w \cdot x_0 + b wx0+b

    • 这个表达式表示 x 0 x_0 x0 代入超平面方程 w ⋅ x + b = 0 w \cdot x + b = 0 wx+b=0 后的值。它可以看作 x 0 x_0 x0 点相对于超平面的“签名距离”(带正负符号的距离)。如果结果为正,则点 x 0 x_0 x0 在超平面的一侧;如果为负,则在另一侧;如果为零,则点 x 0 x_0 x0 刚好位于超平面上。
  2. ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣

    • ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣ 是权重向量 w w w 的 L2 范数,即权重向量的欧几里得长度。它用于将点积结果进行标准化,使得我们得到的距离是点到超平面的垂直距离,而不是简单的点积结果。
  3. 1 ∣ ∣ w ∣ ∣ \frac{1}{||w||} ∣∣w∣∣1

    • 通过将点积结果除以 ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣,我们消除了方向的影响,得到的是点 x 0 x_0 x0 到超平面的最短距离,而不是简单的欧几里得距离。这确保了无论 w w w 向量的大小如何,计算出的距离都能正确反映点到超平面的真实距离。
  4. ∣ w ⋅ x 0 + b ∣ |w \cdot x_0 + b| wx0+b

    • 绝对值符号消除了结果的正负号,使我们关心的只是距离的大小,而不是点位于超平面的哪一侧。

几何解释:

超平面可以看作是 n 维空间中的一个 ( n − 1 ) (n-1) (n1) 维的分隔线或分隔面。公式 8-3 表示从点 x 0 x_0 x0 垂直到超平面的距离。这个公式给出的距离是经过标准化的,因此它独立于权重 w w w 的规模。

总结:

公式 8-3 给出了任意输入点 x 0 x_0 x0 到由权重向量 w w w 和偏置 b b b 所定义的超平面的垂直距离。这在感知机学习中很重要,因为我们希望通过调整权重和偏置,将误分类样本的距离缩短,从而将它们正确分类到超平面的一侧。


http://www.kler.cn/news/341100.html

相关文章:

  • 【c++实现tcp客户端】
  • 前端模块化CommonJs、ESM、AMD总结
  • 【PGCCC】在 Postgres 上构建图像搜索引擎
  • 详情说明HTTP/2和HTTP/3两者间的区别
  • 影刀RPA在智能客服上的运用
  • 水污染急需机器人,材料局限遇难题,MXene 水凝胶有潜力
  • 21-DevOps项目发布一体化平台构建及应用实践
  • 使用fastjson解析json格式数据
  • 【海思方案的4G低功耗抓拍摄像机模组方案】
  • 关于学习神经网络的一些感悟
  • 【多线程】多线程(10):常见锁策略,锁原理,CAS
  • 欧姆龙(Omron)协议解析
  • uniapp 设置 tabbar 的 midButton 按钮
  • 软考新教程10月出版?11月软考会用到新内容吗?
  • excel表格转换为在线成绩查询怎么制作?
  • 2024年区块链钱包现状与未来趋势分析
  • 微信小程序处理交易投诉管理,支持多小程序,一键授权模式
  • LangChain入门
  • 串接模式对网络性能的影响
  • [实时计算flink]双流JOIN语句