线性判别分析 (LDA)中目标函数两个相似公式 分子 之间的转换过程
本文是对以下文章的分子部分更加详细的说明
线性判别分析 (LDA)中目标函数两个相似公式之间的转换过程
二次型是指一个关于向量的二次函数,通常表示为 Q ( x ) = x T A x Q(x) = x^T A x Q(x)=xTAx,其中 x x x 是一个列向量, A A A 是一个对称矩阵。二次型在数学中用于描述涉及向量和矩阵的二次关系。
我们更详细地解释如何将标量平方 ( w T ( μ 0 − μ 1 ) ) 2 \left( w^T (\mu_0 - \mu_1) \right)^2 (wT(μ0−μ1))2 表示为二次型 w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w wT(μ0−μ1)(μ0−μ1)Tw。
详细步骤:
-
标量平方的展开:
首先,注意到 ( w T ( μ 0 − μ 1 ) ) \left( w^T (\mu_0 - \mu_1) \right) (wT(μ0−μ1)) 是一个标量。因此,其平方可以表示为:
( w T ( μ 0 − μ 1 ) ) 2 = ( w T ( μ 0 − μ 1 ) ) ( w T ( μ 0 − μ 1 ) ) \left( w^T (\mu_0 - \mu_1) \right)^2 = \left( w^T (\mu_0 - \mu_1) \right) \left( w^T (\mu_0 - \mu_1) \right) (wT(μ0−μ1))2=(wT(μ0−μ1))(wT(μ0−μ1)) -
利用标量乘积的性质:
标量的乘积可以重新排列,因为标量相乘满足交换律:
( w T ( μ 0 − μ 1 ) ) ( w T ( μ 0 − μ 1 ) ) = ( w T ( μ 0 − μ 1 ) ) ( ( μ 0 − μ 1 ) T w ) \left( w^T (\mu_0 - \mu_1) \right) \left( w^T (\mu_0 - \mu_1) \right) = \left( w^T (\mu_0 - \mu_1) \right) \left( (\mu_0 - \mu_1)^T w \right) (wT(μ0−μ1))(wT(μ0−μ1))=(wT(μ0−μ1))((μ0−μ1)Tw)这里,我们利用了以下事实:
- ( w T ( μ 0 − μ 1 ) ) \left( w^T (\mu_0 - \mu_1) \right) (wT(μ0−μ1)) 是标量。
- ( ( μ 0 − μ 1 ) T w ) \left( (\mu_0 - \mu_1)^T w \right) ((μ0−μ1)Tw) 也是标量,且等于 ( w T ( μ 0 − μ 1 ) ) \left( w^T (\mu_0 - \mu_1) \right) (wT(μ0−μ1))。
-
重新排列表达式:
现在,我们可以将标量乘积写成矩阵和向量的乘积形式:
( w T ( μ 0 − μ 1 ) ) ( ( μ 0 − μ 1 ) T w ) = w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w \left( w^T (\mu_0 - \mu_1) \right) \left( (\mu_0 - \mu_1)^T w \right) = w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w (wT(μ0−μ1))((μ0−μ1)Tw)=wT(μ0−μ1)(μ0−μ1)Tw这一步中,我们将两个标量乘积重新排列为矩阵乘积:
- 首先, w T ( μ 0 − μ 1 ) w^T (\mu_0 - \mu_1) wT(μ0−μ1) 是一个 1 × 1 1 \times 1 1×1 的标量。
- 然后, ( μ 0 − μ 1 ) T w (\mu_0 - \mu_1)^T w (μ0−μ1)Tw 也是一个标量。
- 将这两个标量相乘,可以视为矩阵乘法中的括号重新组合。
-
理解矩阵乘法的维度匹配:
为了确保上述等式成立,我们需要检查矩阵维度:
-
( μ 0 − μ 1 ) (\mu_0 - \mu_1) (μ0−μ1) 是一个 n × 1 n \times 1 n×1 的列向量。
-
( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0−μ1)T 是一个 1 × n 1 \times n 1×n 的行向量。
-
因此, ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T (μ0−μ1)(μ0−μ1)T 是一个 n × n n \times n n×n 的矩阵。
-
w w w 是一个 n × 1 n \times 1 n×1 的列向量。
-
w T w^T wT 是一个 1 × n 1 \times n 1×n 的行向量。
-
因此, w T ( μ 0 − μ 1 ) w^T (\mu_0 - \mu_1) wT(μ0−μ1) 是一个标量( 1 × 1 1 \times 1 1×1)。
-
同样地, ( μ 0 − μ 1 ) T w (\mu_0 - \mu_1)^T w (μ0−μ1)Tw 也是一个标量。
-
最终, w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w wT(μ0−μ1)(μ0−μ1)Tw 是一个标量,计算过程为:
w T [ ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T ] w w^T [(\mu_0 - \mu_1)(\mu_0 - \mu_1)^T] w wT[(μ0−μ1)(μ0−μ1)T]w这里,内部的 ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T (μ0−μ1)(μ0−μ1)T 是矩阵,外部的 w T w^T wT 和 w w w 分别是行向量和列向量。
-
-
总结:
通过上述步骤,我们成功地将标量平方表示为涉及矩阵和向量的二次型:
( w T ( μ 0 − μ 1 ) ) 2 = w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w \left( w^T (\mu_0 - \mu_1) \right)^2 = w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w (wT(μ0−μ1))2=wT(μ0−μ1)(μ0−μ1)Tw这就是将标量平方转换为二次型的详细过程。
结论:
-
二次型是指形如 Q ( x ) = x T A x Q(x) = x^T A x Q(x)=xTAx 的函数,其中 A A A 是对称矩阵, x x x 是向量。
-
我们将标量平方 ( w T ( μ 0 − μ 1 ) ) 2 \left( w^T (\mu_0 - \mu_1) \right)^2 (wT(μ0−μ1))2 转换为二次型的步骤是:
- 将标量平方展开为自身的乘积。
- 利用标量乘积的交换性质,重新排列为矩阵和向量的乘积。
- 将表达式写成 w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w wT(μ0−μ1)(μ0−μ1)Tw 的形式。
通过这些步骤,我们成功地将原始的标量平方表达式表示为二次型形式,使得两个公式的分子部分等价。