向量与矩阵几何关系
目录
- 一、基向量
- 二、向量与基向量
- 三、向量张成的空间
- 四、矩阵与线性变换
- 五、矩阵乘法与线性变换复合
一、基向量
基向量(basis vectors)是构成向量空间的一组基本元素,它们满足以下条件:
- 线性无关:基中的向量之间不能通过线性组合相互表示。这意味着没有一个向量可以表示为其他向量的线性组合。
- 生成空间:基向量的线性组合能够生成整个向量空间。也就是说,空间中的任何向量都可以通过基向量的线性组合来表示。
- 最小性:基是构成向量空间的最小集合,没有多余的向量。如果从基中移除任何一个向量,剩余的向量将无法生成整个空间。
不同的向量空间中,基向量可以有不同的形式:
- 标准基:在 R n \mathbb{R}^n Rn 空间中,标准基通常由单位向量 e 1 , e 2 , … , e n e_1,e_2,\dots,e_n e1,e2,…,en 组成,其中每个单位向量的第 i i i分量是 1,其余分量都是 0。例如,在三维空间中,标准基可以是 e 1 = [ 1 , 0 , 0 ] T , e 2 = [ 0 , 1 , 0 ] T , e 1 = [ 0 , 0 , 1 ] T e_1 = [1,0,0]^T,e_2 = [0,1,0]^T,e_1 = [0,0,1]^T e1=[1,0,0]T,e2=[0,1,0]T,e1=[0,0,1]T。
- 非标准基:在实际问题中,基向量不一定是单位向量,它们可以是任意的线性无关向量。例如,在经济学中,一组经济指标可能构成一个向量空间的基。
- 正交基和标准正交基:在内积空间中,如果基向量之间相互正交(即内积为零),则称为正交基。如果正交基中的向量都是单位向量,则称为标准正交基。
- 基变换:在不同的基下,同一个向量的表示(坐标)是不同的。基变换是从一个基到另一个基的坐标转换过程。
二、向量与基向量
如图,想象向量(3,-2)是一个标量,它将
i
i
i 帽拉伸3倍,
j
j
j 帽 反向拉伸2倍。从这个角度看,这个向量是经过两个缩放向量的和。
3
i
+
(
−
2
j
)
3i + (-2j)
3i+(−2j)
此处
i
i
i 与
j
j
j 是
x
y
xy
xy 坐标系的基向量。
每当我们用数字描述向量时,它都依赖于我们正在使用的基。
两个向量的标量乘法之和的结果,被成为两个向量的线性组合。如
a
v
⃗
+
b
w
⃗
a \vec v + b \vec w
av+bw
三、向量张成的空间
向量张成的空间,也称为向量生成的空间或线性空间,是指由一组向量通过线性组合构成的集合。这个空间包含了所有可能的线性组合,其中每个组合由基向量和相应的标量系数组成。
以下是向量张成空间的一些关键概念:
-
线性组合:给定一组向量 { v 1 , v 2 , … , v n } \{ v_1,v_2,\dots,v_n\} {v1,v2,…,vn}和一组标量 { c 1 , c 2 , … , c n } \{ c_1,c_2,\dots,c_n\} {c1,c2,…,cn},这些向量的线性组合可以表示为:
c 1 v 1 + c 2 v 2 + ⋯ + c n v n c_1v_1 + c_2v_2 + \dots +c_nv_n c1v1+c2v2+⋯+cnvn -
生成空间:由一组向量生成的空间是所有这些向量线性组合的集合。如果这组向量是线性无关的,那么它们就构成了一个基,生成的空间是这些基向量张成的空间。
-
基和维度:一个向量空间的基是一组线性无关的向量,它们可以生成整个空间。基向量的数量称为空间的维度。例如,三维空间的基通常包含三个线性无关的向量。
-
子空间:如果一个向量空间是由另一个更大向量空间中的向量通过线性组合构成的,那么这个较小的空间称为子空间。所有子空间都是向量空间。
-
线性无关与线性相关:如果一组向量中的任何一个向量不能由其他向量线性表示,则称这组向量线性无关。如果至少有一个向量可以由其他向量线性表示,则称这组向量线性相关。
-
封闭性:向量空间对加法和标量乘法是封闭的,这意味着向量空间中任意两个向量的和以及任意向量与标量的乘积仍然在该空间内
对于大部分二维向量来说,其张成空间是整个无限大的二维平面。但如果两个基向量共线,它张成的空间就是一条直线;
三维空间中两个向量张成的空间是三维空间中经过原点的平面。
四、矩阵与线性变换
什么是线性变换:
接收一个向量并且输出一个向量的变换。
线性变换特点:
- ①直线在变换后仍然保持为直线,不能有所弯曲
- ②原点必须保持固定
总的来说,应该把线性变换看作是保持网格线平行并且等距分布的变换。
变换之后
i
i
i 帽经过变换之后由原来的
(
0
,
1
)
(0,1)
(0,1)变换到了
(
1
,
−
2
)
(1,-2)
(1,−2)
j
j
j 帽经过变换之后由原来的
(
1
,
0
)
(1,0)
(1,0) 变换到了
(
3
,
0
)
(3,0)
(3,0)
只要我们记录了
i
帽和
j
帽
i 帽和j帽
i帽和j帽 的落脚点,我们可以推断出任意向量的落脚点。
一般情况下,一个向量的坐标为
(
x
,
y
)
(x,y)
(x,y)
假定
i
i
i 帽的落脚点为(-1,2), j
帽落脚点为
(
3
,
0
)
帽落脚点为(3,0)
帽落脚点为(3,0),那么该向量的最终坐标如下:
i
⟶
[
1
−
2
]
i \longrightarrow \left[ \begin{matrix} 1 \\ -2 \\ \end{matrix} \right]
i⟶[1−2]
j
⟶
[
3
0
]
j \longrightarrow \left[ \begin{matrix} 3 \\ 0 \\ \end{matrix} \right]
j⟶[30]
[
x
y
]
⟶
x
[
1
−
2
]
+
y
[
3
0
]
=
[
1
x
+
3
y
−
2
x
+
0
y
]
\left[ \begin{matrix} x \\ y \\ \end{matrix} \right] \longrightarrow x \left[ \begin{matrix} 1 \\ -2 \\ \end{matrix} \right] + y \left[ \begin{matrix} 3 \\ 0 \\ \end{matrix} \right] = \left[ \begin{matrix} 1x+3y \\ -2x+0y \\ \end{matrix} \right]
[xy]⟶x[1−2]+y[30]=[1x+3y−2x+0y]
一个二维线性变换仅由4个数字完全确定。
对于一个2 x 2的矩阵
[
3
2
−
2
1
]
\left[ \begin{matrix} 3 & 2 \\ -2 & 1 \\ \end{matrix} \right]
[3−221]
第一列可以看做是变换后的
i
i
i 落脚位置 ,第二列可以看做是变换后的
j
j
j 落脚位置
给定一个任意初始向量
[
5
7
]
\left[ \begin{matrix} 5 \\ 7 \\ \end{matrix} \right]
[57]
那么矩阵对该向量的作用,只需要将
x
与
y
x与y
x与y 取出,将它们分别于矩阵特定的列相乘然后结果相加即可。这与"缩放基向量再相加"的思想是一致的。
矩阵向量乘法表示:
[
a
b
c
d
]
[
x
y
]
=
x
[
a
c
]
+
y
[
b
d
]
=
[
a
x
+
b
y
c
x
+
d
y
]
\left[ \begin{matrix} a & b\\ c & d \\ \end{matrix} \right] \left[ \begin{matrix} x \\ y \\ \end{matrix} \right] = x \left[ \begin{matrix} a \\ c \\ \end{matrix} \right] +y \left[ \begin{matrix} b \\ d \\ \end{matrix} \right] = \left[ \begin{matrix} ax+by \\ cx+dy \\ \end{matrix} \right]
[acbd][xy]=x[ac]+y[bd]=[ax+bycx+dy]
五、矩阵乘法与线性变换复合
矩阵的乘积可以看作是一个变换之后再进行一种变换,即两个独立变换的复合变换。
两个矩阵相乘有着几何意义,也就是两个线性变换的相继意义。
首先应用右侧矩阵所描述的变换,然后再用左侧矩阵所描述的变换。此处即是先旋转再剪切。
举例如下:
现在有如下两个矩阵
m 2 = [ 0 2 1 0 ] , m 1 = [ 1 − 2 1 0 ] m_2 =\left [ \begin{matrix} 0 & 2\\ 1 & 0 \\ \end{matrix} \right] , m_1= \left[ \begin{matrix} 1 & -2 \\ 1 & 0 \\ \end{matrix} \right] m2=[0120],m1=[11−20]
计算 m 2 × m 1 m_2 \times m_1 m2×m1
i
i
i 帽的新坐标由
m
1
m_1
m1 的第一列给出,也就是
(
1
,
1
)
(1,1)
(1,1)
经过
m
2
m_2
m2 作用之后会发生什么呢?
我们将矩阵
m
2
m_2
m2 乘以向量
(
1
,
1
)
(1,1)
(1,1),得到复合矩阵的第一列。
[ 0 2 1 0 ] [ 1 1 ] = 1 [ 0 1 ] + 1 [ 2 0 ] = [ 2 1 ] \left[ \begin{matrix} 0 & 2\\ 1 & 0 \\ \end{matrix} \right] \left[ \begin{matrix} 1 \\ 1 \\ \end{matrix} \right] = 1 \left[ \begin{matrix} 0 \\ 1 \\ \end{matrix} \right] +1 \left[ \begin{matrix} 2 \\ 0 \\ \end{matrix} \right] = \left[ \begin{matrix} 2 \\ 1 \\ \end{matrix} \right] [0120][11]=1[01]+1[20]=[21]
同理可以计算
j
j
j 帽
j
j
j 帽的新坐标由
m
1
m_1
m1 的第二列给出,也就是
(
−
2
,
0
)
(-2,0)
(−2,0),将
m
2
m_2
m2 作用于该向量,可得到复合矩阵的第二列。
[ 0 2 1 0 ] [ − 2 0 ] = − 2 [ 0 1 ] + 0 [ 2 0 ] = [ 0 − 2 ] \left[ \begin{matrix} 0 & 2\\ 1 & 0 \\ \end{matrix} \right] \left[ \begin{matrix} -2 \\ 0 \\ \end{matrix} \right] = -2 \left[ \begin{matrix} 0 \\ 1 \\ \end{matrix} \right] +0 \left[ \begin{matrix} 2 \\ 0 \\ \end{matrix} \right] = \left[ \begin{matrix} 0 \\ -2 \\ \end{matrix} \right] [0120][−20]=−2[01]+0[20]=[0−2]
矩阵乘法公式推导
[
a
b
c
d
]
[
e
f
g
h
]
=
[
a
e
+
b
y
a
f
+
b
h
c
e
+
d
g
c
f
+
d
h
]
\left[ \begin{matrix} a & b\\ c & d \\ \end{matrix} \right] \left[ \begin{matrix} e & f \\ g & h \\ \end{matrix} \right] = \left[ \begin{matrix} ae+by & af+bh \\ ce+dg & cf+dh \\ \end{matrix} \right]
[acbd][egfh]=[ae+byce+dgaf+bhcf+dh]
过程如下:
i
i
i 帽的计算(复合矩阵第一列)
[
a
b
c
d
]
[
e
g
]
=
e
[
a
c
]
+
g
[
b
d
]
=
[
a
e
+
b
y
c
e
+
d
y
]
\left[ \begin{matrix} a & b\\ c & d \\ \end{matrix} \right] \left[ \begin{matrix} e \\ g \\ \end{matrix} \right] = e \left[ \begin{matrix} a \\ c \\ \end{matrix} \right] +g \left[ \begin{matrix} b \\ d \\ \end{matrix} \right] = \left[ \begin{matrix} ae+by \\ ce+dy \\ \end{matrix} \right]
[acbd][eg]=e[ac]+g[bd]=[ae+byce+dy]
j
j
j 帽的计算(复合矩阵第二列)
[
a
b
c
d
]
[
f
h
]
=
f
[
a
c
]
+
h
[
b
d
]
=
[
a
f
+
b
h
c
f
+
d
h
]
\left[ \begin{matrix} a & b\\ c & d \\ \end{matrix} \right] \left[ \begin{matrix} f \\ h \\ \end{matrix} \right] = f \left[ \begin{matrix} a \\ c \\ \end{matrix} \right] +h \left[ \begin{matrix} b \\ d \\ \end{matrix} \right] = \left[ \begin{matrix} af+bh \\ cf+dh \\ \end{matrix} \right]
[acbd][fh]=f[ac]+h[bd]=[af+bhcf+dh]