Math Reference Notes: 矩阵基础
矩阵(Matrix)是一个按行和列排列的数字、符号或数学对象的二维数组。矩阵广泛应用于各个领域,尤其是在数学、物理学、计算机科学、工程学、数据科学等领域。矩阵不仅仅是一个数据容器,它具有独特的数学性质和丰富的运算规则。
1. 矩阵的定义
一个矩阵是由 m m m 行和 n n n 列的元素组成的矩形数组,通常记作 A = [ a i j ] A = [a_{ij}] A=[aij],其中 a i j a_{ij} aij 表示矩阵 A A A 中第 i i i 行、第 j j j 列的元素。
示例:
一个
3
×
2
3 \times 2
3×2 的矩阵(即3行2列矩阵):
A
=
(
1
2
3
4
5
6
)
A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix}
A=
135246
这里,矩阵
A
A
A 有 3 行和 2 列,元素分别为:
- a 11 = 1 a_{11} = 1 a11=1, a 12 = 2 a_{12} = 2 a12=2(第一行)
- a 21 = 3 a_{21} = 3 a21=3, a 22 = 4 a_{22} = 4 a22=4(第二行)
- a 31 = 5 a_{31} = 5 a31=5, a 32 = 6 a_{32} = 6 a32=6(第三行)
2. 矩阵的维度(阶数)
矩阵的维度是它的行数和列数的组合,通常表示为 m × n m \times n m×n,其中 m m m 是矩阵的行数, n n n 是矩阵的列数。
- 矩阵的阶数:矩阵的阶数是指其行数和列数。例如, 3 × 2 3 \times 2 3×2 矩阵的阶数是 3 行 2 列,写作 3 × 2 3 \times 2 3×2 矩阵。
示例:
- 3 × 2 3 \times 2 3×2 矩阵: A = ( 1 2 3 4 5 6 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix} A= 135246
- 2 × 3 2 \times 3 2×3 矩阵: B = ( 7 8 9 10 11 12 ) B = \begin{pmatrix} 7 & 8 & 9 \\ 10 & 11 & 12 \end{pmatrix} B=(710811912)
3. 矩阵的常见类型
-
零矩阵(Zero Matrix):
所有元素为零的矩阵称为零矩阵,通常记作 0 0 0。
Z = ( 0 0 0 0 ) Z = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix} Z=(0000)
对于任意大小的零矩阵,所有元素均为 0 0 0,如 3 × 3 3 \times 3 3×3 的零矩阵:
Z = ( 0 0 0 0 0 0 0 0 0 ) Z = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} Z= 000000000 -
单位矩阵(Identity Matrix):
单位矩阵是一个方阵(行数等于列数),主对角线元素为 1,其余元素为 0。
例如, 2 × 2 2 \times 2 2×2 单位矩阵:
I 2 = ( 1 0 0 1 ) I_2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} I2=(1001)
对于 n × n n \times n n×n 的单位矩阵,记作 I n I_n In。单位矩阵具有以下性质:- A I n = I n A = A AI_n = I_nA = A AIn=InA=A( A A A 为 n × n n \times n n×n 矩阵)。
- 单位矩阵是矩阵乘法中的乘法单位元。
-
对角矩阵(Diagonal Matrix):
对角矩阵是指除了主对角线上的元素外,其余元素都为零的矩阵。
例如, 3 × 3 3 \times 3 3×3 的对角矩阵:
D = ( 3 0 0 0 4 0 0 0 5 ) D = \begin{pmatrix} 3 & 0 & 0 \\ 0 & 4 & 0 \\ 0 & 0 & 5 \end{pmatrix} D= 300040005
对角矩阵的性质:- 对角矩阵的转置仍为对角矩阵。
- 两个对角矩阵相乘仍为对角矩阵。
-
标量矩阵(Scalar Matrix):
标量矩阵是所有主对角线上的元素相等,其余元素为零的矩阵。
例如:
S = ( 5 0 0 0 5 0 0 0 5 ) S = \begin{pmatrix} 5 & 0 & 0 \\ 0 & 5 & 0 \\ 0 & 0 & 5 \end{pmatrix} S= 500050005
标量矩阵是单位矩阵的一个特殊形式,可以写作 S = λ I n S = \lambda I_n S=λIn,其中 λ \lambda λ 为常数。 -
行矩阵和列矩阵:
- 行矩阵:只有一行的矩阵,形式为
1
×
n
1 \times n
1×n。
R = ( 1 2 3 ) R = \begin{pmatrix} 1 & 2 & 3 \end{pmatrix} R=(123) - 列矩阵:只有一列的矩阵,形式为
m
×
1
m \times 1
m×1。
C = ( 1 2 3 ) C = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix} C= 123
行矩阵和列矩阵在向量空间中分别对应行向量和列向量。
- 行矩阵:只有一行的矩阵,形式为
1
×
n
1 \times n
1×n。
-
方阵(Square Matrix):
行数等于列数的矩阵称为方阵。
例如, 3 × 3 3 \times 3 3×3 方阵:
A = ( 1 2 3 4 5 6 7 8 9 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix} A= 147258369
方阵具有许多特殊类型,如对称矩阵、三角矩阵等。 -
对称矩阵(Symmetric Matrix):
对称矩阵是指矩阵等于其转置矩阵,即 A = A T A = A^T A=AT。
例如:
A = ( 1 2 3 2 4 5 3 5 6 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{pmatrix} A= 123245356
对称矩阵的性质:- 对称矩阵的特征值均为实数。
- 对称矩阵可以进行正交对角化。
-
上三角矩阵和下三角矩阵:
- 上三角矩阵(Upper Triangular Matrix):矩阵的下三角部分(主对角线以下)元素全为零。
例如:
U = ( 1 2 3 0 4 5 0 0 6 ) U = \begin{pmatrix} 1 & 2 & 3 \\ 0 & 4 & 5 \\ 0 & 0 & 6 \end{pmatrix} U= 100240356 - 下三角矩阵(Lower Triangular Matrix):矩阵的上三角部分(主对角线以上)元素全为零。
例如:
L = ( 1 0 0 4 5 0 7 8 9 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 4 & 5 & 0 \\ 7 & 8 & 9 \end{pmatrix} L= 147058009
三角矩阵在线性方程组求解和矩阵分解中具有重要作用。
- 上三角矩阵(Upper Triangular Matrix):矩阵的下三角部分(主对角线以下)元素全为零。
-
奇异矩阵和非奇异矩阵
-
奇异矩阵(Singular Matrix):
行列式为零的方阵称为奇异矩阵,记作 det ( A ) = 0 \det(A) = 0 det(A)=0。
例如:
A = ( 2 1 4 2 ) , det ( A ) = 2 × 2 − 1 × 4 = 0 A = \begin{pmatrix} 2 & 1 \\ 4 & 2 \end{pmatrix}, \quad \det(A) = 2 \times 2 - 1 \times 4 = 0 A=(2412),det(A)=2×2−1×4=0
奇异矩阵没有逆矩阵,因此在求解线性方程组时可能存在无解或无唯一解的情况。 -
非奇异矩阵(Non-Singular Matrix):
行列式不为零的方阵称为非奇异矩阵,记作 det ( A ) ≠ 0 \det(A) \neq 0 det(A)=0。
例如:
B = ( 3 1 2 5 ) , det ( B ) = 3 × 5 − 1 × 2 = 13 ≠ 0 B = \begin{pmatrix} 3 & 1 \\ 2 & 5 \end{pmatrix}, \quad \det(B) = 3 \times 5 - 1 \times 2 = 13 \neq 0 B=(3215),det(B)=3×5−1×2=13=0非奇异矩阵具有唯一的逆矩阵,且在求解线性方程组时总有唯一解。
奇异矩阵通常出现在矩阵列向量线性相关的情况下,此时矩阵的秩小于其阶数。非奇异矩阵则表示矩阵的列向量线性无关,其秩等于矩阵的阶数。
-
4. 矩阵的运算
矩阵之间可以进行各种运算,包括加法、减法、标量乘法、矩阵乘法、转置等。
-
矩阵加法和减法
矩阵的加法和减法是按元素进行的,要求两个矩阵的维度必须相同。
-
矩阵加法:
对于矩阵 A = ( a i j ) A = \begin{pmatrix} a_{ij} \end{pmatrix} A=(aij) 和 B = ( b i j ) B = \begin{pmatrix} b_{ij} \end{pmatrix} B=(bij),
A + B = ( a 11 + b 11 a 12 + b 12 ⋮ ⋮ ) A + B = \begin{pmatrix} a_{11} + b_{11} & a_{12} + b_{12} \\ \vdots & \vdots \end{pmatrix} A+B=(a11+b11⋮a12+b12⋮) -
矩阵减法:
对于矩阵 A = ( a i j ) A = \begin{pmatrix} a_{ij} \end{pmatrix} A=(aij) 和 B = ( b i j ) B = \begin{pmatrix} b_{ij} \end{pmatrix} B=(bij),
A − B = ( a 11 − b 11 a 12 − b 12 ⋮ ⋮ ) A - B = \begin{pmatrix} a_{11} - b_{11} & a_{12} - b_{12} \\ \vdots & \vdots \end{pmatrix} A−B=(a11−b11⋮a12−b12⋮)
-
-
标量乘法
标量乘法是指矩阵的每个元素都乘以一个常数(标量)。如果矩阵 A = ( a i j ) A = \begin{pmatrix} a_{ij} \end{pmatrix} A=(aij),并且标量为 k k k,则:
k A = ( k ⋅ a 11 k ⋅ a 12 ⋮ k ⋅ a m n ) kA = \begin{pmatrix} k \cdot a_{11} & k \cdot a_{12} \\ \vdots & k \cdot a_{mn} \end{pmatrix} kA=(k⋅a11⋮k⋅a12k⋅amn) -
矩阵乘法
矩阵乘法的规则是:矩阵 A A A 的列数必须等于矩阵 B B B 的行数,才能进行乘法运算。矩阵乘法的结果是一个新矩阵,其第 i i i 行第 j j j 列的元素是矩阵 A A A 的第 i i i 行与矩阵 B B B 的第 j j j 列对应元素的乘积之和。
假设:
A = ( a 11 a 12 a 21 a 22 ) , B = ( b 11 b 12 b 21 b 22 ) A = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}, \quad B = \begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{pmatrix} A=(a11a21a12a22),B=(b11b21b12b22)
那么 A ⋅ B A \cdot B A⋅B 的计算如下:
A ⋅ B = ( a 11 ⋅ b 11 + a 12 ⋅ b 21 a 11 ⋅ b 12 + a 12 ⋅ b 22 a 21 ⋅ b 11 + a 22 ⋅ b 21 a 21 ⋅ b 12 + a 22 ⋅ b 22 ) A \cdot B = \begin{pmatrix} a_{11} \cdot b_{11} + a_{12} \cdot b_{21} & a_{11} \cdot b_{12} + a_{12} \cdot b_{22} \\ a_{21} \cdot b_{11} + a_{22} \cdot b_{21} & a_{21} \cdot b_{12} + a_{22} \cdot b_{22} \end{pmatrix} A⋅B=(a11⋅b11+a12⋅b21a21⋅b11+a22⋅b21a11⋅b12+a12⋅b22a21⋅b12+a22⋅b22) -
矩阵转置
矩阵的转置是将矩阵的行和列互换,得到的新矩阵记作 A T A^T AT。
假设:
A = ( a 11 a 12 a 21 a 22 ) A = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix} A=(a11a21a12a22)
那么 A T A^T AT 为:
A T = ( a 11 a 21 a 12 a 22 ) A^T = \begin{pmatrix} a_{11} & a_{21} \\ a_{12} & a_{22} \end{pmatrix} AT=(a11a12a21a22) -
矩阵的逆
矩阵的逆(如果存在)是一个矩阵 A − 1 A^{-1} A−1,使得:
A ⋅ A − 1 = A − 1 ⋅ A = I A \cdot A^{-1} = A^{-1} \cdot A = I A⋅A−1=A−1⋅A=I
其中 I I I 是单位矩阵。只有可逆矩阵(行列式不为零的方阵)才存在逆矩阵。示例:
对于矩阵 A = ( 1 2 3 4 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} A=(1324),其逆矩阵 A − 1 A^{-1} A−1 可以通过特定的公式计算:
A − 1 = 1 det ( A ) ( d − b − c a ) A^{-1} = \frac{1}{\text{det}(A)} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix} A−1=det(A)1(d−c−ba)
其中 a , b , c , d a, b, c, d a,b,c,d 是矩阵 A A A 的元素, det ( A ) \text{det}(A) det(A) 是矩阵 A A A 的行列式。
5. 矩阵的应用
-
线性方程组的求解
矩阵是求解线性方程组的重要工具。线性方程组
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases} ⎩ ⎨ ⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm
可以表示为矩阵形式 A X = B AX = B AX=B,其中 A A A 是系数矩阵, X X X 是未知量向量, B B B 是常数向量。常见的求解方法包括:
- 高斯消元法
- 矩阵求逆法(适用于系数矩阵 A A A 为非奇异矩阵)
- LU 分解
- QR 分解
-
线性变换
矩阵可以表示线性变换。常见的线性变换包括:
- 旋转:二维或三维空间中的旋转操作可以通过特定的旋转矩阵来实现。
- 缩放:缩放矩阵用于改变对象的大小。
- 反射:反射矩阵表示空间中的镜像操作。
- 平移:在齐次坐标下,矩阵可以表示平移操作。
线性变换在计算机图形学、几何建模、物理仿真等领域有广泛应用。
-
图像处理
在图像处理中,矩阵用于表示图像的像素数据。常见操作包括:
- 滤波:利用卷积矩阵对图像进行平滑、边缘检测等操作。
- 变换:通过傅里叶变换、离散余弦变换(DCT)、奇异值分解(SVD)等方法对图像进行处理和压缩。
- 仿射变换:使用矩阵对图像进行旋转、缩放、平移和剪切等操作。
-
数据科学和机器学习
在数据科学和机器学习中,矩阵用于表示数据集和特征。矩阵运算在以下方面尤为重要:
- 主成分分析(PCA):通过矩阵分解来降维,提取数据的主要特征。
- 线性回归:使用矩阵表示模型和数据,求解回归系数。
- 神经网络:权重和输入通常表示为矩阵形式,前向传播和反向传播过程中涉及大量矩阵乘法与加法操作。
- 协同过滤:在推荐系统中,矩阵分解(如 SVD、非负矩阵分解)常用于预测用户-物品的评分矩阵。
-
图论与网络分析
图可以用矩阵表示,其中:
- 邻接矩阵表示顶点之间的边连接关系。
- 度矩阵表示每个顶点的度数。
- 拉普拉斯矩阵用于图的谱分析,在聚类、分割等问题中有重要作用。
网络分析中的许多算法(如 PageRank 算法)依赖于矩阵运算。
-
量子计算
量子态和量子门可以用矩阵来描述。在量子计算中,幺矩阵(保持内积的矩阵)表示量子门操作,密度矩阵用于描述混合态。
-
物理与工程
矩阵广泛应用于物理和工程领域,例如:
- 振动分析:通过矩阵描述多自由度系统的运动方程。
- 电路分析:在节点电压法中,矩阵用于表示电路的方程组。
- 控制系统:在状态空间模型中,系统的状态方程和输出方程均可表示为矩阵形式。
矩阵的应用几乎涵盖了科学与工程的所有领域,成为现代科学技术的重要工具。