机器学习数学基础:18.向量组及其线性组合
向量组与线性表示:案例与教程详解
一、基础概念
(一)向量组
向量组是若干同位数列向量组成的集合。比如在平面直角坐标系中,向量组 { α ⃗ 1 = [ 1 0 ] , α ⃗ 2 = [ 0 1 ] } \{\vec{\alpha}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}, \vec{\alpha}_2 \ = \begin{bmatrix}0\\1\end{bmatrix}\} {α1 =[10],α2 =[01]},这两个向量都是二维列向量,构成了一个简单的向量组。再如三维空间里的向量组 { β ⃗ 1 = [ 1 2 3 ] , β ⃗ 2 = [ 4 5 6 ] } \{\vec{\beta}_1 \ = \begin{bmatrix}1\\2\\3\end{bmatrix}, \vec{\beta}_2 \ = \begin{bmatrix}4\\5\\6\end{bmatrix}\} {β1 = 123 ,β2 = 456 },它们是三维列向量组。
(二)秩
秩可理解为有效方程或独立向量的个数。以方程组 { x + 2 y = 3 2 x + 4 y = 6 \begin{cases}x + 2y \ = 3 \\ 2x + 4y \ = 6\end{cases} {x+2y =32x+4y =6为例,第二个方程是第一个方程的 2 倍,实际上只有一个有效方程,对应的向量组 { [ 1 2 ] , [ 2 4 ] } \{\begin{bmatrix}1\\2\end{bmatrix}, \begin{bmatrix}2\\4\end{bmatrix}\} {[12],[24]}的秩为 1,因为只有一个独立向量(第二个向量可由第一个向量乘以 2 得到)。确定秩的方法通常是将向量组构成的矩阵化为行阶梯形矩阵,非零行的行数就是秩。
二、向量的线性表示
(一)定义与判定
若存在一组数 λ 1 , λ 2 , ⋯ , λ m \lambda_1, \lambda_2, \cdots, \lambda_m λ1,λ2,⋯,λm,使 β ⃗ = λ 1 α ⃗ 1 + λ 2 α ⃗ 2 + ⋯ + λ m α ⃗ m \vec{\beta} \ = \lambda_1\vec{\alpha}_1 + \lambda_2\vec{\alpha}_2 + \cdots + \lambda_m\vec{\alpha}_m β =λ1α1+λ2α2+⋯+λmαm,则向量 β ⃗ \vec{\beta} β能由向量组 α ⃗ 1 , α ⃗ 2 , ⋯ , α ⃗ m \vec{\alpha}_1, \vec{\alpha}_2, \cdots, \vec{\alpha}_m α1,α2,⋯,αm线性表示。
案例:设向量组
α
⃗
1
=
[
1
1
]
\vec{\alpha}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}
α1 =[11],
α
⃗
2
=
[
2
2
]
\vec{\alpha}_2 \ = \begin{bmatrix}2\\2\end{bmatrix}
α2 =[22],
β
⃗
=
[
3
3
]
\vec{\beta} \ = \begin{bmatrix}3\\3\end{bmatrix}
β =[33]。判断
β
⃗
\vec{\beta}
β能否由
α
⃗
1
,
α
⃗
2
\vec{\alpha}_1, \vec{\alpha}_2
α1,α2线性表示。
从线性方程组角度,设
β
⃗
=
x
α
⃗
1
+
y
α
⃗
2
\vec{\beta} \ = x\vec{\alpha}_1 + y\vec{\alpha}_2
β =xα1+yα2,即
[
3
3
]
=
x
[
1
1
]
+
y
[
2
2
]
\begin{bmatrix}3\\3\end{bmatrix} \ = x\begin{bmatrix}1\\1\end{bmatrix} + y\begin{bmatrix}2\\2\end{bmatrix}
[33] =x[11]+y[22],可化为方程组
{
x
+
2
y
=
3
x
+
2
y
=
3
\begin{cases}x + 2y \ = 3 \\ x + 2y \ = 3\end{cases}
{x+2y =3x+2y =3。
计算向量组
α
⃗
1
,
α
⃗
2
\vec{\alpha}_1, \vec{\alpha}_2
α1,α2构成的矩阵
A
=
[
1
2
1
2
]
A \ = \begin{bmatrix}1&2\\1&2\end{bmatrix}
A =[1122]的秩
r
(
A
)
r(A)
r(A),通过初等行变换得到
[
1
2
0
0
]
\begin{bmatrix}1&2\\0&0\end{bmatrix}
[1020],
r
(
A
)
=
1
r(A)\ =1
r(A) =1。
增广矩阵
(
A
∣
β
⃗
)
=
[
1
2
3
1
2
3
]
(A|\vec{\beta}) \ = \begin{bmatrix}1&2&3\\1&2&3\end{bmatrix}
(A∣β) =[112233],经初等行变换为
[
1
2
3
0
0
0
]
\begin{bmatrix}1&2&3\\0&0&0\end{bmatrix}
[102030],秩
r
(
A
∣
β
⃗
)
=
1
r(A|\vec{\beta}) \ = 1
r(A∣β) =1。
因为
r
(
A
)
=
r
(
A
∣
β
⃗
)
=
1
r(A)\ =r(A|\vec{\beta}) \ = 1
r(A) =r(A∣β) =1,所以方程组有解,
β
⃗
\vec{\beta}
β能由
α
⃗
1
,
α
⃗
2
\vec{\alpha}_1, \vec{\alpha}_2
α1,α2线性表示,且
β
⃗
=
3
α
⃗
1
+
0
α
⃗
2
\vec{\beta} \ = 3\vec{\alpha}_1 + 0\vec{\alpha}_2
β =3α1+0α2。
(二)求解线性表示表达式
教程:
- 将向量组 α ⃗ 1 , α ⃗ 2 , ⋯ , α ⃗ m \vec{\alpha}_1, \vec{\alpha}_2, \cdots, \vec{\alpha}_m α1,α2,⋯,αm构成系数矩阵 A A A,向量 β ⃗ \vec{\beta} β构成增广矩阵 ( A ∣ β ⃗ ) (A|\vec{\beta}) (A∣β)。
- 对增广矩阵进行初等行变换化为行最简形矩阵。
- 从行最简形矩阵读取线性表示的系数。
案例:向量组
α
⃗
1
=
[
1
2
]
\vec{\alpha}_1 \ = \begin{bmatrix}1\\2\end{bmatrix}
α1 =[12],
α
⃗
2
=
[
2
3
]
\vec{\alpha}_2 \ = \begin{bmatrix}2\\3\end{bmatrix}
α2 =[23],
β
⃗
=
[
3
4
]
\vec{\beta} \ = \begin{bmatrix}3\\4\end{bmatrix}
β =[34]。
构建增广矩阵
[
1
2
3
2
3
4
]
\begin{bmatrix}1&2&3\\2&3&4\end{bmatrix}
[122334]。
进行初等行变换:
- 第二行减去第一行的 2 倍,得 [ 1 2 3 0 − 1 − 2 ] \begin{bmatrix}1&2&3\\0& - 1& - 2\end{bmatrix} [102−13−2]。
- 第二行乘以 - 1,得 [ 1 2 3 0 1 2 ] \begin{bmatrix}1&2&3\\0&1&2\end{bmatrix} [102132]。
- 第一行减去第二行的 2 倍,得
[
1
0
−
1
0
1
2
]
\begin{bmatrix}1&0& - 1\\0&1&2\end{bmatrix}
[1001−12]。
所以 β ⃗ = − 1 α ⃗ 1 + 2 α ⃗ 2 \vec{\beta} \ = - 1\vec{\alpha}_1 + 2\vec{\alpha}_2 β =−1α1+2α2。
三、向量组之间的关系
(一)相互线性表示
设有向量组 ( I ) : α ⃗ 1 , α ⃗ 2 (I): \vec{\alpha}_1, \vec{\alpha}_2 (I):α1,α2及向量组 ( I I ) : β ⃗ 1 , β ⃗ 2 (II): \vec{\beta}_1, \vec{\beta}_2 (II):β1,β2。若向量组 ( I I ) (II) (II)中每个向量都能由向量组 ( I ) (I) (I)线性表示,如 β ⃗ 1 = x 1 α ⃗ 1 + y 1 α ⃗ 2 \vec{\beta}_1 \ = x_1\vec{\alpha}_1 + y_1\vec{\alpha}_2 β1 =x1α1+y1α2, β ⃗ 2 = x 2 α ⃗ 1 + y 2 α ⃗ 2 \vec{\beta}_2 \ = x_2\vec{\alpha}_1 + y_2\vec{\alpha}_2 β2 =x2α1+y2α2,则称向量组 ( I I ) (II) (II)能由向量组 ( I ) (I) (I)线性表示。
(二)向量组等价
定义:若向量组 ( I ) (I) (I)与向量组 ( I I ) (II) (II)可以相互线性表示,则称这两个向量组等价。
判定:
- 充要条件是 r ( I ) = r ( I I ) = r ( I , I I ) r(I) \ = r(II) \ = r(I, II) r(I) =r(II) =r(I,II)。
- 若向量组 ( I ) (I) (I)可由向量组 ( I I ) (II) (II)线性表示且 r ( I ) = r ( I I ) r(I) \ = r(II) r(I) =r(II),则两个向量组等价。
案例:向量组
(
I
)
:
α
⃗
1
=
[
1
0
]
(I): \vec{\alpha}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}
(I):α1 =[10],
α
⃗
2
=
[
0
1
]
\vec{\alpha}_2 \ = \begin{bmatrix}0\\1\end{bmatrix}
α2 =[01];向量组
(
I
I
)
:
β
⃗
1
=
[
1
1
]
(II): \vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}
(II):β1 =[11],
β
⃗
2
=
[
2
2
]
\vec{\beta}_2 \ = \begin{bmatrix}2\\2\end{bmatrix}
β2 =[22]。
向量组
(
I
)
(I)
(I)的秩
r
(
I
)
=
2
r(I)\ =2
r(I) =2。
β
⃗
1
=
α
⃗
1
+
α
⃗
2
\vec{\beta}_1 \ = \vec{\alpha}_1 + \vec{\alpha}_2
β1 =α1+α2,
β
⃗
2
=
2
α
⃗
1
+
2
α
⃗
2
\vec{\beta}_2 \ = 2\vec{\alpha}_1 + 2\vec{\alpha}_2
β2 =2α1+2α2,所以向量组
(
I
I
)
(II)
(II)能由向量组
(
I
)
(I)
(I)线性表示。
将向量组合并为
(
I
,
I
I
)
:
α
⃗
1
,
α
⃗
2
,
β
⃗
1
,
β
⃗
2
(I, II): \vec{\alpha}_1, \vec{\alpha}_2, \vec{\beta}_1, \vec{\beta}_2
(I,II):α1,α2,β1,β2,其秩
r
(
I
,
I
I
)
=
2
r(I, II)\ =2
r(I,II) =2。
α
⃗
1
=
β
⃗
1
−
α
⃗
2
\vec{\alpha}_1 \ = \vec{\beta}_1 - \vec{\alpha}_2
α1 =β1−α2(这里
α
⃗
2
\vec{\alpha}_2
α2可由
β
⃗
1
\vec{\beta}_1
β1和
α
⃗
1
\vec{\alpha}_1
α1表示,且
α
⃗
1
\vec{\alpha}_1
α1本身存在),
α
⃗
2
=
β
⃗
1
−
α
⃗
1
\vec{\alpha}_2 \ = \vec{\beta}_1 - \vec{\alpha}_1
α2 =β1−α1,所以向量组
(
I
)
(I)
(I)能由向量组
(
I
I
)
(II)
(II)线性表示,且
r
(
I
I
)
=
2
r(II)\ =2
r(II) =2,满足
r
(
I
)
=
r
(
I
I
)
=
r
(
I
,
I
I
)
r(I) \ = r(II) \ = r(I, II)
r(I) =r(II) =r(I,II),两个向量组等价。
(三)相关结论
1. 被表示的秩不大
设向量组
(
I
)
=
{
α
⃗
1
=
[
1
0
]
}
(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}\right\}
(I) ={α1 =[10]},这是一个一维向量组,其秩
r
(
I
)
=
1
r(I)\ =1
r(I) =1。
向量组
(
I
I
)
=
{
β
⃗
1
=
[
1
0
]
,
β
⃗
2
=
[
0
1
]
}
(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}, \vec{\beta}_2 \ = \begin{bmatrix}0\\1\end{bmatrix}\right\}
(II) ={β1 =[10],β2 =[01]},这是一个二维向量组,其秩
r
(
I
I
)
=
2
r(II)\ =2
r(II) =2。
可以发现向量组
(
I
)
(I)
(I)中的向量
α
⃗
1
\vec{\alpha}_1
α1能由向量组
(
I
I
)
(II)
(II)中的向量表示,即
α
⃗
1
=
1
×
β
⃗
1
+
0
×
β
⃗
2
\vec{\alpha}_1 \ = 1\times\vec{\beta}_1 + 0\times\vec{\beta}_2
α1 =1×β1+0×β2,满足向量组
(
I
)
(I)
(I)可由向量组
(
I
I
)
(II)
(II)表示。同时,
r
(
I
)
=
1
≤
r
(
I
I
)
=
2
r(I)\ =1\leq r(II)\ =2
r(I) =1≤r(II) =2,验证了“被表示的秩不大”这一结论。
2. 被表示的可丢掉
设向量组
(
I
)
=
{
α
⃗
1
=
[
2
2
]
}
(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}2\\2\end{bmatrix}\right\}
(I) ={α1 =[22]},向量组
(
I
I
)
=
{
β
⃗
1
=
[
1
1
]
}
(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}\right\}
(II) ={β1 =[11]}。
因为
α
⃗
1
=
2
×
β
⃗
1
\vec{\alpha}_1 \ = 2\times\vec{\beta}_1
α1 =2×β1,所以向量组
(
I
)
(I)
(I)可由向量组
(
I
I
)
(II)
(II)表示。
向量组
(
I
I
)
(II)
(II)构成的矩阵为
B
=
[
1
1
]
B \ = \begin{bmatrix}1\\1\end{bmatrix}
B =[11],其秩
r
(
I
I
)
=
1
r(II)\ =1
r(II) =1。
将向量组
(
I
)
(I)
(I)和
(
I
I
)
(II)
(II)合并得到向量组
(
I
I
,
I
)
=
{
β
⃗
1
=
[
1
1
]
,
α
⃗
1
=
[
2
2
]
}
(II, I)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}, \vec{\alpha}_1 \ = \begin{bmatrix}2\\2\end{bmatrix}\right\}
(II,I) ={β1 =[11],α1 =[22]},构成的矩阵
C
=
[
1
2
1
2
]
C\ =\begin{bmatrix}1&2\\1&2\end{bmatrix}
C =[1122],通过初等行变换可得
[
1
2
0
0
]
\begin{bmatrix}1&2\\0&0\end{bmatrix}
[1020],其秩
r
(
I
I
,
I
)
=
1
r(II, I)\ =1
r(II,I) =1。
所以
r
(
I
I
)
=
r
(
I
I
,
I
)
=
1
r(II)\ =r(II, I)\ =1
r(II) =r(II,I) =1,说明了在向量组
(
I
)
(I)
(I)可由向量组
(
I
I
)
(II)
(II)表示时,
r
(
I
I
)
=
r
(
I
I
,
I
)
r(II) \ = r(II, I)
r(II) =r(II,I),即被表示的可丢掉。
3. 但 ( I I ) (II) (II)不可由 ( I ) (I) (I)表示时的秩关系
设向量组
(
I
)
=
{
α
⃗
1
=
[
1
0
0
]
}
(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\0\\0\end{bmatrix}\right\}
(I) =⎩
⎨
⎧α1 =
100
⎭
⎬
⎫,秩
r
(
I
)
=
1
r(I)\ =1
r(I) =1。
向量组
(
I
I
)
=
{
β
⃗
1
=
[
1
0
0
]
,
β
⃗
2
=
[
0
1
0
]
}
(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\0\\0\end{bmatrix}, \vec{\beta}_2 \ = \begin{bmatrix}0\\1\\0\end{bmatrix}\right\}
(II) =⎩
⎨
⎧β1 =
100
,β2 =
010
⎭
⎬
⎫,秩
r
(
I
I
)
=
2
r(II)\ =2
r(II) =2。
显然向量组
(
I
)
(I)
(I)中的
α
⃗
1
\vec{\alpha}_1
α1可由向量组
(
I
I
)
(II)
(II)表示,
α
⃗
1
=
1
×
β
⃗
1
+
0
×
β
⃗
2
\vec{\alpha}_1 \ = 1\times\vec{\beta}_1 + 0\times\vec{\beta}_2
α1 =1×β1+0×β2。
但向量组
(
I
I
)
(II)
(II)中的
β
⃗
2
\vec{\beta}_2
β2无法由向量组
(
I
)
(I)
(I)表示,因为仅
α
⃗
1
\vec{\alpha}_1
α1无法组合出在
y
y
y轴上有分量的向量。此时
r
(
I
)
=
1
<
r
(
I
I
)
=
2
r(I)\ =1< r(II)\ =2
r(I) =1<r(II) =2,符合“若向量组
(
I
)
(I)
(I)可由向量组
(
I
I
)
(II)
(II)表示,但
(
I
I
)
(II)
(II)不可由
(
I
)
(I)
(I)表示,则
r
(
I
)
<
r
(
I
I
)
r(I) < r(II)
r(I)<r(II)”这一结论。
4. 以少表多,多必相关
设向量组
(
I
)
=
{
α
⃗
1
=
[
1
1
]
,
α
⃗
2
=
[
2
2
]
,
α
⃗
3
=
[
3
3
]
}
(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}, \vec{\alpha}_2 \ = \begin{bmatrix}2\\2\end{bmatrix}, \vec{\alpha}_3 \ = \begin{bmatrix}3\\3\end{bmatrix}\right\}
(I) ={α1 =[11],α2 =[22],α3 =[33]},向量组
(
I
I
)
=
{
β
⃗
1
=
[
1
1
]
}
(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}\right\}
(II) ={β1 =[11]}。
可以看到
α
⃗
1
=
1
×
β
⃗
1
\vec{\alpha}_1 \ = 1\times\vec{\beta}_1
α1 =1×β1,
α
⃗
2
=
2
×
β
⃗
1
\vec{\alpha}_2 \ = 2\times\vec{\beta}_1
α2 =2×β1,
α
⃗
3
=
3
×
β
⃗
1
\vec{\alpha}_3 \ = 3\times\vec{\beta}_1
α3 =3×β1,即向量组
(
I
)
(I)
(I)可由向量组
(
I
I
)
(II)
(II)表示。
向量组
(
I
)
(I)
(I)中有
3
3
3个向量,向量组
(
I
I
)
(II)
(II)中有
1
1
1个向量,
(
I
)
(I)
(I)中向量个数大于
(
I
I
)
(II)
(II)中向量个数。
对于向量组
(
I
)
(I)
(I),存在不全为零的数
k
1
=
−
3
k_1\ =-3
k1 =−3,
k
2
=
3
k_2 \ = 3
k2 =3,
k
3
=
−
1
k_3\ =-1
k3 =−1,使得
k
1
α
⃗
1
+
k
2
α
⃗
2
+
k
3
α
⃗
3
=
[
−
3
+
6
−
3
−
3
+
6
−
3
]
=
[
0
0
]
k_1\vec{\alpha}_1 + k_2\vec{\alpha}_2 + k_3\vec{\alpha}_3\ =\begin{bmatrix}-3 + 6 - 3\\-3 + 6 - 3\end{bmatrix}\ =\begin{bmatrix}0\\0\end{bmatrix}
k1α1+k2α2+k3α3 =[−3+6−3−3+6−3] =[00],满足线性相关的定义,所以向量组
(
I
)
(I)
(I)一定线性相关,验证了“以少表多,多必相关”的结论。