当前位置: 首页 > article >正文

Math Reference Notes: 矩阵基础

矩阵(Matrix)是一个按行和列排列的数字、符号或数学对象的二维数组。矩阵广泛应用于各个领域,尤其是在数学、物理学、计算机科学、工程学、数据科学等领域。矩阵不仅仅是一个数据容器,它具有独特的数学性质和丰富的运算规则。


1. 矩阵的定义

一个矩阵是由 m m m 行和 n n n 列的元素组成的矩形数组,通常记作 A = [ a i j ] A = [a_{ij}] A=[aij],其中 a i j a_{ij} aij 表示矩阵 A A A 中第 i i i 行、第 j j j 列的元素。

示例:

一个 3 × 2 3 \times 2 3×2 的矩阵(即3行2列矩阵):
A = ( 1 2 3 4 5 6 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix} A= 135246
这里,矩阵 A A A 有 3 行和 2 列,元素分别为:

  • a 11 = 1 a_{11} = 1 a11=1, a 12 = 2 a_{12} = 2 a12=2(第一行)
  • a 21 = 3 a_{21} = 3 a21=3, a 22 = 4 a_{22} = 4 a22=4(第二行)
  • a 31 = 5 a_{31} = 5 a31=5, a 32 = 6 a_{32} = 6 a32=6(第三行)

2. 矩阵的维度(阶数)

矩阵的维度是它的行数和列数的组合,通常表示为 m × n m \times n m×n,其中 m m m 是矩阵的行数, n n n 是矩阵的列数。

  • 矩阵的阶数:矩阵的阶数是指其行数和列数。例如, 3 × 2 3 \times 2 3×2 矩阵的阶数是 3 行 2 列,写作 3 × 2 3 \times 2 3×2 矩阵。

示例:

  • 3 × 2 3 \times 2 3×2 矩阵: A = ( 1 2 3 4 5 6 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{pmatrix} A= 135246
  • 2 × 3 2 \times 3 2×3 矩阵: B = ( 7 8 9 10 11 12 ) B = \begin{pmatrix} 7 & 8 & 9 \\ 10 & 11 & 12 \end{pmatrix} B=(710811912)

3. 矩阵的常见类型

  1. 零矩阵(Zero Matrix):
    所有元素为零的矩阵称为零矩阵,通常记作 0 0 0
    Z = ( 0 0 0 0 ) Z = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix} Z=(0000)
    对于任意大小的零矩阵,所有元素均为 0 0 0,如 3 × 3 3 \times 3 3×3 的零矩阵:
    Z = ( 0 0 0 0 0 0 0 0 0 ) Z = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} Z= 000000000

  2. 单位矩阵(Identity Matrix):
    单位矩阵是一个方阵(行数等于列数),主对角线元素为 1,其余元素为 0。
    例如, 2 × 2 2 \times 2 2×2 单位矩阵:
    I 2 = ( 1 0 0 1 ) I_2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} I2=(1001)
    对于 n × n n \times n n×n 的单位矩阵,记作 I n I_n In。单位矩阵具有以下性质:

    • A I n = I n A = A AI_n = I_nA = A AIn=InA=A A A A n × n n \times n n×n 矩阵)。
    • 单位矩阵是矩阵乘法中的乘法单位元。
  3. 对角矩阵(Diagonal Matrix):
    对角矩阵是指除了主对角线上的元素外,其余元素都为零的矩阵。
    例如, 3 × 3 3 \times 3 3×3 的对角矩阵:
    D = ( 3 0 0 0 4 0 0 0 5 ) D = \begin{pmatrix} 3 & 0 & 0 \\ 0 & 4 & 0 \\ 0 & 0 & 5 \end{pmatrix} D= 300040005
    对角矩阵的性质:

    • 对角矩阵的转置仍为对角矩阵。
    • 两个对角矩阵相乘仍为对角矩阵。
  4. 标量矩阵(Scalar Matrix):
    标量矩阵是所有主对角线上的元素相等,其余元素为零的矩阵。
    例如:
    S = ( 5 0 0 0 5 0 0 0 5 ) S = \begin{pmatrix} 5 & 0 & 0 \\ 0 & 5 & 0 \\ 0 & 0 & 5 \end{pmatrix} S= 500050005
    标量矩阵是单位矩阵的一个特殊形式,可以写作 S = λ I n S = \lambda I_n S=λIn,其中 λ \lambda λ 为常数。

  5. 行矩阵和列矩阵

    • 行矩阵:只有一行的矩阵,形式为 1 × n 1 \times n 1×n
      R = ( 1 2 3 ) R = \begin{pmatrix} 1 & 2 & 3 \end{pmatrix} R=(123)
    • 列矩阵:只有一列的矩阵,形式为 m × 1 m \times 1 m×1
      C = ( 1 2 3 ) C = \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix} C= 123
      行矩阵和列矩阵在向量空间中分别对应行向量和列向量。
  6. 方阵(Square Matrix):
    行数等于列数的矩阵称为方阵。
    例如, 3 × 3 3 \times 3 3×3 方阵:
    A = ( 1 2 3 4 5 6 7 8 9 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix} A= 147258369
    方阵具有许多特殊类型,如对称矩阵、三角矩阵等。

  7. 对称矩阵(Symmetric Matrix):
    对称矩阵是指矩阵等于其转置矩阵,即 A = A T A = A^T A=AT
    例如:
    A = ( 1 2 3 2 4 5 3 5 6 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{pmatrix} A= 123245356
    对称矩阵的性质:

    • 对称矩阵的特征值均为实数。
    • 对称矩阵可以进行正交对角化。
  8. 上三角矩阵和下三角矩阵

    • 上三角矩阵(Upper Triangular Matrix):矩阵的下三角部分(主对角线以下)元素全为零。
      例如:
      U = ( 1 2 3 0 4 5 0 0 6 ) U = \begin{pmatrix} 1 & 2 & 3 \\ 0 & 4 & 5 \\ 0 & 0 & 6 \end{pmatrix} U= 100240356
    • 下三角矩阵(Lower Triangular Matrix):矩阵的上三角部分(主对角线以上)元素全为零。
      例如:
      L = ( 1 0 0 4 5 0 7 8 9 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 4 & 5 & 0 \\ 7 & 8 & 9 \end{pmatrix} L= 147058009

    三角矩阵在线性方程组求解和矩阵分解中具有重要作用。

  9. 奇异矩阵和非奇异矩阵

    • 奇异矩阵(Singular Matrix):
      行列式为零的方阵称为奇异矩阵,记作 det ⁡ ( A ) = 0 \det(A) = 0 det(A)=0
      例如:
      A = ( 2 1 4 2 ) , det ⁡ ( A ) = 2 × 2 − 1 × 4 = 0 A = \begin{pmatrix} 2 & 1 \\ 4 & 2 \end{pmatrix}, \quad \det(A) = 2 \times 2 - 1 \times 4 = 0 A=(2412),det(A)=2×21×4=0
      奇异矩阵没有逆矩阵,因此在求解线性方程组时可能存在无解或无唯一解的情况。

    • 非奇异矩阵(Non-Singular Matrix):
      行列式不为零的方阵称为非奇异矩阵,记作 det ⁡ ( A ) ≠ 0 \det(A) \neq 0 det(A)=0
      例如:
      B = ( 3 1 2 5 ) , det ⁡ ( B ) = 3 × 5 − 1 × 2 = 13 ≠ 0 B = \begin{pmatrix} 3 & 1 \\ 2 & 5 \end{pmatrix}, \quad \det(B) = 3 \times 5 - 1 \times 2 = 13 \neq 0 B=(3215),det(B)=3×51×2=13=0

      非奇异矩阵具有唯一的逆矩阵,且在求解线性方程组时总有唯一解。

    奇异矩阵通常出现在矩阵列向量线性相关的情况下,此时矩阵的秩小于其阶数。非奇异矩阵则表示矩阵的列向量线性无关,其秩等于矩阵的阶数。

4. 矩阵的运算

矩阵之间可以进行各种运算,包括加法、减法、标量乘法、矩阵乘法、转置等。

  1. 矩阵加法和减法

    矩阵的加法和减法是按元素进行的,要求两个矩阵的维度必须相同。

    • 矩阵加法
      对于矩阵 A = ( a i j ) A = \begin{pmatrix} a_{ij} \end{pmatrix} A=(aij) B = ( b i j ) B = \begin{pmatrix} b_{ij} \end{pmatrix} B=(bij)
      A + B = ( a 11 + b 11 a 12 + b 12 ⋮ ⋮ ) A + B = \begin{pmatrix} a_{11} + b_{11} & a_{12} + b_{12} \\ \vdots & \vdots \end{pmatrix} A+B=(a11+b11a12+b12)

    • 矩阵减法
      对于矩阵 A = ( a i j ) A = \begin{pmatrix} a_{ij} \end{pmatrix} A=(aij) B = ( b i j ) B = \begin{pmatrix} b_{ij} \end{pmatrix} B=(bij)
      A − B = ( a 11 − b 11 a 12 − b 12 ⋮ ⋮ ) A - B = \begin{pmatrix} a_{11} - b_{11} & a_{12} - b_{12} \\ \vdots & \vdots \end{pmatrix} AB=(a11b11a12b12)

  2. 标量乘法

    标量乘法是指矩阵的每个元素都乘以一个常数(标量)。如果矩阵 A = ( a i j ) A = \begin{pmatrix} a_{ij} \end{pmatrix} A=(aij),并且标量为 k k k,则:
    k A = ( k ⋅ a 11 k ⋅ a 12 ⋮ k ⋅ a m n ) kA = \begin{pmatrix} k \cdot a_{11} & k \cdot a_{12} \\ \vdots & k \cdot a_{mn} \end{pmatrix} kA=(ka11ka12kamn)

  3. 矩阵乘法

    矩阵乘法的规则是:矩阵 A A A 的列数必须等于矩阵 B B B 的行数,才能进行乘法运算。矩阵乘法的结果是一个新矩阵,其第 i i i 行第 j j j 列的元素是矩阵 A A A 的第 i i i 行与矩阵 B B B 的第 j j j 列对应元素的乘积之和。

    假设:
    A = ( a 11 a 12 a 21 a 22 ) , B = ( b 11 b 12 b 21 b 22 ) A = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}, \quad B = \begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{pmatrix} A=(a11a21a12a22),B=(b11b21b12b22)
    那么 A ⋅ B A \cdot B AB 的计算如下:
    A ⋅ B = ( a 11 ⋅ b 11 + a 12 ⋅ b 21 a 11 ⋅ b 12 + a 12 ⋅ b 22 a 21 ⋅ b 11 + a 22 ⋅ b 21 a 21 ⋅ b 12 + a 22 ⋅ b 22 ) A \cdot B = \begin{pmatrix} a_{11} \cdot b_{11} + a_{12} \cdot b_{21} & a_{11} \cdot b_{12} + a_{12} \cdot b_{22} \\ a_{21} \cdot b_{11} + a_{22} \cdot b_{21} & a_{21} \cdot b_{12} + a_{22} \cdot b_{22} \end{pmatrix} AB=(a11b11+a12b21a21b11+a22b21a11b12+a12b22a21b12+a22b22)

  4. 矩阵转置

    矩阵的转置是将矩阵的行和列互换,得到的新矩阵记作 A T A^T AT

    假设:
    A = ( a 11 a 12 a 21 a 22 ) A = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix} A=(a11a21a12a22)
    那么 A T A^T AT 为:
    A T = ( a 11 a 21 a 12 a 22 ) A^T = \begin{pmatrix} a_{11} & a_{21} \\ a_{12} & a_{22} \end{pmatrix} AT=(a11a12a21a22)

  5. 矩阵的逆

    矩阵的逆(如果存在)是一个矩阵 A − 1 A^{-1} A1,使得:
    A ⋅ A − 1 = A − 1 ⋅ A = I A \cdot A^{-1} = A^{-1} \cdot A = I AA1=A1A=I
    其中 I I I 是单位矩阵。只有可逆矩阵(行列式不为零的方阵)才存在逆矩阵。

    示例:
    对于矩阵 A = ( 1 2 3 4 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} A=(1324),其逆矩阵 A − 1 A^{-1} A1 可以通过特定的公式计算:
    A − 1 = 1 det ( A ) ( d − b − c a ) A^{-1} = \frac{1}{\text{det}(A)} \begin{pmatrix} d & -b \\ -c & a \end{pmatrix} A1=det(A)1(dcba)
    其中 a , b , c , d a, b, c, d a,b,c,d 是矩阵 A A A 的元素, det ( A ) \text{det}(A) det(A) 是矩阵 A A A 的行列式。

5. 矩阵的应用

  1. 线性方程组的求解

    矩阵是求解线性方程组的重要工具。线性方程组
    { a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases} a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm
    可以表示为矩阵形式 A X = B AX = B AX=B,其中 A A A 是系数矩阵, X X X 是未知量向量, B B B 是常数向量。

    常见的求解方法包括:

    • 高斯消元法
    • 矩阵求逆法(适用于系数矩阵 A A A 为非奇异矩阵)
    • LU 分解
    • QR 分解
  2. 线性变换

    矩阵可以表示线性变换。常见的线性变换包括:

    • 旋转:二维或三维空间中的旋转操作可以通过特定的旋转矩阵来实现。
    • 缩放:缩放矩阵用于改变对象的大小。
    • 反射:反射矩阵表示空间中的镜像操作。
    • 平移:在齐次坐标下,矩阵可以表示平移操作。
      线性变换在计算机图形学、几何建模、物理仿真等领域有广泛应用。
  3. 图像处理

    在图像处理中,矩阵用于表示图像的像素数据。常见操作包括:

    • 滤波:利用卷积矩阵对图像进行平滑、边缘检测等操作。
    • 变换:通过傅里叶变换、离散余弦变换(DCT)、奇异值分解(SVD)等方法对图像进行处理和压缩。
    • 仿射变换:使用矩阵对图像进行旋转、缩放、平移和剪切等操作。
  4. 数据科学和机器学习

    在数据科学和机器学习中,矩阵用于表示数据集和特征。矩阵运算在以下方面尤为重要:

    • 主成分分析(PCA):通过矩阵分解来降维,提取数据的主要特征。
    • 线性回归:使用矩阵表示模型和数据,求解回归系数。
    • 神经网络:权重和输入通常表示为矩阵形式,前向传播和反向传播过程中涉及大量矩阵乘法与加法操作。
    • 协同过滤:在推荐系统中,矩阵分解(如 SVD、非负矩阵分解)常用于预测用户-物品的评分矩阵。
  5. 图论与网络分析

    图可以用矩阵表示,其中:

    • 邻接矩阵表示顶点之间的边连接关系。
    • 度矩阵表示每个顶点的度数。
    • 拉普拉斯矩阵用于图的谱分析,在聚类、分割等问题中有重要作用。
      网络分析中的许多算法(如 PageRank 算法)依赖于矩阵运算。
  6. 量子计算

    量子态和量子门可以用矩阵来描述。在量子计算中,幺矩阵(保持内积的矩阵)表示量子门操作,密度矩阵用于描述混合态。

  7. 物理与工程

    矩阵广泛应用于物理和工程领域,例如:

    • 振动分析:通过矩阵描述多自由度系统的运动方程。
    • 电路分析:在节点电压法中,矩阵用于表示电路的方程组。
    • 控制系统:在状态空间模型中,系统的状态方程和输出方程均可表示为矩阵形式。

矩阵的应用几乎涵盖了科学与工程的所有领域,成为现代科学技术的重要工具。


http://www.kler.cn/a/507563.html

相关文章:

  • 我的世界-与门、或门、非门等基本门电路实现
  • “飞的”点外卖,科技新潮流来袭
  • Linux浅谈——管道、网络配置和客户端软件的使用
  • Ansible自动化运维:基础与实践
  • Multi-Agent如何设计
  • 我这不需要保留本地修改, 只需要拉取远程更改
  • Android adb 调试,不在手机上点击信任 “允许usb调试” 即可连接的方式(手机需root)
  • 浅谈云计算20 | OpenStack管理模块(下)
  • CV与NLP经典大模型解读
  • RAG 切块Chunk技术总结与自定义分块实现思路
  • Node.js path.join
  • UE控件学习
  • 你会选择java还是node做后台管理
  • 青少年CTF练习平台 文章管理系统(sqlmap使用os-shell找flag)PHP
  • 选择saas 还是源码主要考虑
  • 网络编程:基于TCP/UDP实现客户端和服务端通信(C语言实现简单易懂)
  • 如何在若依框架中自定义添加一个页面
  • 相机拍照参数:WB、FF、S、ISO、EV、焦距
  • 08、如何预防SQL注入
  • 《机器学习》——PCA降维
  • 1.快慢指针-力扣-283-移动零
  • 软件测试入门—功能需求分析:以一个旅游管理系统为例
  • LeetCode 1426 题:数元素解题全解析
  • 【机器学习实战入门项目】MNIST数字分类机器学习项目
  • 用C++实现一个基于模板的观察者设计模式
  • MySQL的不同SQL模式导致行为不同?