当前位置: 首页 > article >正文

机器学习--支持向量机(SVM)

支持向量机(线性) S V M SVM SVM

引入

S V M SVM SVM 用于解决的问题也是 c l a s s i f i c a t i o n classification classification,这里 y ∈ { − 1 , 1 } y \in \{-1, 1\} y{1,1}

  比如说这样一个需要分类的训练数据:

在这里插入图片描述

  我们可以有很多直线来分开这两坨东西,就像这样:

在这里插入图片描述

  我们看到这三条线 l 1 , l 2 l_1, l_2 l1,l2 l 3 l_3 l3,我们显然可以看出来 l 1 l_1 l1 l 2 l_2 l2 l 3 l_3 l3 要更优秀,但是我们怎么定义这个所谓的 “优秀” 呢?

间隔 M a r g i n Margin Margin 和 最小化 ∣ w ∣ |w| w

  我们这样理解,考虑将 l l l 在样本空间中平移,直到这条直线第一次碰到两组东西数据时停止。这样我们能得到两根 “边界线”(图中绿色的线)。

在这里插入图片描述

  我们发现,我们认为最优秀的线所形成的 “边界线” 的距离是最大的,我们把这个距离成为间隔 m a r g i n margin margin。于是在 S V M SVM SVM 的思想中,我们就是要找到 m a r g i n margin margin 最大的那条线。

  我们把这些"平移过程中第一次碰到的向量"称为支持向量

  我们把这条线根据之前的习惯写成这样:

h ( x ) = w T x h(x) = w^Tx h(x)=wTx

  然后我们考虑如何计算出 m a r g i n margin margin。首先对于一个支持向量 x ( i ) x^{(i)} x(i) 来说,它到直线的距离可以写成:

d = ∣ ∑ j = 0 n w j x j ( i ) ∣ ∑ j = 1 n w j 2 = ∣ w T x ( i ) ∣ ∣ w ∣ d = \frac{\bigg|\sum\limits_{j = 0}^n w_jx^{(i)}_j \bigg|}{\sqrt{\sum\limits_{j = 1}^n w_j^2}} = \frac{\bigg|w^Tx^{(i)}\bigg|}{|w|} d=j=1nwj2 j=0nwjxj(i) =w wTx(i)

  然后又因为我们知道, h ( x ) = w T x h(x) = w^Tx h(x)=wTx h ( x ) = ( a w ) T x h(x) = (aw)^Tx h(x)=(aw)Tx 本质上表示的是同一条直线(其中 a a a 是常数)。所以我们可以用 a a a 来放缩直线 h ( x ) h(x) h(x),使得 ∣ ( a w ) T x ( i ) ∣ = 1 |(aw)^Tx^{(i)}| = 1 (aw)Tx(i)=1

  此时,支持向量 x ( i ) x^{(i)} x(i) 到直线的距离就是:

d = 1 ∣ w ∣ d = \frac1{|w|} d=w1

  我们希望 d d d 最大,那么我们就希望 ∣ w ∣ |w| w 最小了。

  但是这只是对于支持向量来说,那么对于其他向量来说又要满足什么要求呢?

限制条件

  对于其他非支持向量 x ( j ) x^{(j)} x(j) 来说, x ( j ) x^{(j)} x(j) 到直线的距离显然是大于支持向量 x ( i ) x^{(i)} x(i) 的,所以我们有:

d x ( j ) = ∣ w T x ( j ) ∣ ∣ w ∣ > d x ( i ) = 1 ∣ w ∣ d_{x^{(j)}} = \frac{\bigg|w^Tx^{(j)}\bigg|}{|w|} > d_{x^{(i)}} = \frac 1{|w|} dx(j)=w wTx(j) >dx(i)=w1

  于是我们有:

∣ w T x ( j ) ∣ > 1 \bigg|w^Tx^{(j)}\bigg| > 1 wTx(j) >1

  那么对于所有向量来说:

∣ w T x ∣ ≥ 1 \bigg|w^Tx\bigg| \ge 1 wTx 1

  如果把绝对值去掉的话,我们就要分是 y y y 属于 1 1 1 类还是 − 1 -1 1 类了。而经过分类讨论我们会发现,对于所有向量 x x x,我们都有:

y ( i ) [ w T x ( i ) ] ≥ 1                ( i = 1 ∼ m ) y^{(i)}[w^Tx^{(i)}] \ge 1 \;\;\;\;\;\;\;(i = 1 \sim m) y(i)[wTx(i)]1(i=1m)

总结

  于是我们可以得到支持向量机想要我们做的事就是这样的:

min ⁡ w 1 2 ∣ w ∣ s . t .      y ( i ) [ w T x ( i ) ] ≥ 1 \begin{aligned} \min\limits_{w} \frac 12 &|w| \\ &s.t. \; \;y^{(i)}[w^Tx^{(i)}] \ge 1 \end{aligned} wmin21ws.t.y(i)[wTx(i)]1


http://www.kler.cn/a/300859.html

相关文章:

  • Python股票量化交易分析-开发属于自己的指标
  • OpenCV相机标定与3D重建(55)通用解决 PnP 问题函数solvePnPGeneric()的使用
  • 50.【8】BUUCTF WEB HardSql
  • SuperMap iClient3D for Cesium立体地图选中+下钻特效
  • react中hooks之useEffect 用法总结
  • 学成在线_内容管理模块_创建模块工程
  • 数据分析-螺旋环状气泡图
  • 聊一下测试计划
  • 安卓开发中LiveData的使用
  • 力扣 55题 跳跃游戏 记录
  • 外贸|基于Java+vue的智慧外贸平台系统(源码+数据库+文档)
  • 国家网络安全宣传周 | 2024年网络安全领域重大政策法规一览
  • 【截图服务 +打包】pkg打包 puppeteer
  • iOS 打包上传保存You do not have required contracts to perform an operation
  • 深入了解CSS混合模式
  • 使用 FHE 实现加密大语言模型
  • 机器人--手眼标定算法
  • Android - NDK:jni传递数组参数,获取数组的返回值
  • 【Hot100】LeetCode—300. 最长递增子序列
  • 【Python】selenium实现滚动条滑动效果
  • 市面上有哪些高效财税自动化软件
  • CCF推荐B类会议和期刊总结:(计算机网络领域)
  • 在人工智能与机器学习领域的深度探索:技术价值的全面剖析与产品经理的角色深化
  • 黑马点评24—原理—Redis数据结构
  • Github 2024-09-06 Java开源项目日报Top10
  • 口语笔记——现在完成时