机器学习5_支持向量机_原问题和对偶问题
目录
原问题与对偶问题的定义
定义该原问题的对偶问题如下
在定义了函数 的基础上,对偶问题如下:
综合原问题和对偶问题的定义得到:
定理一
对偶差距(Duality Gap)
强对偶定理(Strong Duality Theorem)
假如 成立,又根据定理一推出不等式
转化为对偶问题
首先将
得到
最小化:
限制条件:
再整理一下
最小化: 或
限制条件:
用对偶理论求解该问题的对偶问题
对偶问题
按照对偶问题的定义,可以将对偶问题写成如下形式:
如何将原问题化为对偶问题
原问题(Prime Problem)
对偶问题(Dual Problem)
原问题与对偶问题的定义
最小化(Minimize):
限制条件(Subject to):
自变量为 多维向量
目标函数是
定义该原问题的对偶问题如下
定义函数:
向量的形式
其中 ,
,
在定义了函数 的基础上,对偶问题如下:
最大化:,所有定义域内的
限制条件:
综合原问题和对偶问题的定义得到:
定理一
如果 是原问题的解, 是对偶问题的解则有:
证明:
是原问题的解
,
是对偶问题的解
对偶差距(Duality Gap)
根据定理一,对偶差距
强对偶定理(Strong Duality Theorem)
如果 ,, 为凸函数,则有 ,则对偶差距为0。
如果:原问题的目标函数是凸函数,限制条件是线性函数。
那么原问题的解 ,对偶差距等于0。
假如 成立,又根据定理一推出不等式
若 ,则定理一中必然能够推出,对于所有的 ,要么 ,要么 。这个条件成为KKT条件。
转化为对偶问题
支持向量机的原问题满足强对偶定理
首先将
转换成
得到
最小化:
限制条件:
(1)
(2)
再整理一下
最小化: 或
情况1 情况2
限制条件:
(1)
(2)
两个限制条件都是线性的,支持向量机的目标函数是凸的,它满足强对偶定理。
用对偶理论求解该问题的对偶问题
对偶问题
自变量 等于这里的
不等式 在这里被分成了两部分,
一部分:
另一部分:
不存在
按照对偶问题的定义,可以将对偶问题写成如下形式:
最大化:
限制条件:
(1)
(2)
如何将原问题化为对偶问题
遍历所有 求最小值
对 求导并令导数为
(1)
(2)
(3)
(1)用的是向量的求导准则,(2)、(3)用的是常规的自变量求导。
将获得的三个式子代入到表达中
将支持向量机的原问题化为对偶问题:
最大化:
限制条件:
(1)
前面:
根据:
(2)