当前位置：首页 > article >正文

线性判别分析（LDA）中求协方差矩阵示例

article 2025/2/2 1:48:15

让我们通过一个简单的例子计算协方差矩阵。假设我们有两类数据集 $X_0$ 和 $X_1$ ，每类有两个样本，每个样本有两个特征。

数据集：

类 0 的样本：
$X_0 = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix}$

类 1 的样本：
$X_1 = \begin{bmatrix} 4 & 5 \\ 5 & 6 \end{bmatrix}$

1. 计算每类的均值向量：

首先，我们需要计算每类数据的均值向量。

对于类 0，均值向量 $\mu_0$ ：
$\mu_0 = \frac{1}{2} \begin{bmatrix} 1+2 \\ 2+3 \end{bmatrix} = \begin{bmatrix} 1.5 \\ 2.5 \end{bmatrix}$

对于类 1，均值向量 $\mu_1$ ：
$\mu_1 = \frac{1}{2} \begin{bmatrix} 4+5 \\ 5+6 \end{bmatrix} = \begin{bmatrix} 4.5 \\ 5.5 \end{bmatrix}$

2. 计算协方差矩阵：

协方差矩阵的公式为：
$\Sigma = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \mu)(x_i - \mu)^T$

对类 0 计算协方差矩阵 $\Sigma_0$ ：

我们对每个样本减去均值向量 $\mu_0$ ，并计算它们的外积。

对于第一个样本 $x_1 = [1, 2]$ ，
$x_1 - \mu_0 = \begin{bmatrix} 1 \\ 2 \end{bmatrix} - \begin{bmatrix} 1.5 \\ 2.5 \end{bmatrix} = \begin{bmatrix} -0.5 \\ -0.5 \end{bmatrix}$

对于第二个样本 $x_2 = [2, 3]$ ，
$x_2 - \mu_0 = \begin{bmatrix} 2 \\ 3 \end{bmatrix} - \begin{bmatrix} 1.5 \\ 2.5 \end{bmatrix} = \begin{bmatrix} 0.5 \\ 0.5 \end{bmatrix}$

接下来，我们计算外积：
$(x_1 - \mu_0)(x_1 - \mu_0)^T = \begin{bmatrix} -0.5 \\ -0.5 \end{bmatrix} \begin{bmatrix} -0.5 & -0.5 \end{bmatrix} = \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix}$
$(x_2 - \mu_0)(x_2 - \mu_0)^T = \begin{bmatrix} 0.5 \\ 0.5 \end{bmatrix} \begin{bmatrix} 0.5 & 0.5 \end{bmatrix} = \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix}$

协方差矩阵为这两个外积的平均：
$\Sigma_0 = \frac{1}{2-1} \left( \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix} + \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix} \right) = \begin{bmatrix} 0.5 & 0.5 \\ 0.5 & 0.5 \end{bmatrix}$

对类 1 计算协方差矩阵 $\Sigma_1$ ：

同样地，对类 1 的样本进行相同的步骤。

对于第一个样本 $x_1 = [4, 5]$ ，
$x_1 - \mu_1 = \begin{bmatrix} 4 \\ 5 \end{bmatrix} - \begin{bmatrix} 4.5 \\ 5.5 \end{bmatrix} = \begin{bmatrix} -0.5 \\ -0.5 \end{bmatrix}$

对于第二个样本 $x_2 = [5, 6]$ ，
$x_2 - \mu_1 = \begin{bmatrix} 5 \\ 6 \end{bmatrix} - \begin{bmatrix} 4.5 \\ 5.5 \end{bmatrix} = \begin{bmatrix} 0.5 \\ 0.5 \end{bmatrix}$

外积分别为：
$(x_1 - \mu_1)(x_1 - \mu_1)^T = \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix}$
$(x_2 - \mu_1)(x_2 - \mu_1)^T = \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix}$

协方差矩阵为：
$\Sigma_1 = \frac{1}{2-1} \left( \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix} + \begin{bmatrix} 0.25 & 0.25 \\ 0.25 & 0.25 \end{bmatrix} \right) = \begin{bmatrix} 0.5 & 0.5 \\ 0.5 & 0.5 \end{bmatrix}$

结果：

对于类 0 和类 1，它们的协方差矩阵分别为：
$\Sigma_0 = \begin{bmatrix} 0.5 & 0.5 \\ 0.5 & 0.5 \end{bmatrix}$
$\Sigma_1 = \begin{bmatrix} 0.5 & 0.5 \\ 0.5 & 0.5 \end{bmatrix}$