矩阵入门——完全指南

学习矩阵基础知识,包括矩阵表示法、运算、行列式、逆矩阵及在方程组、变换和数据科学中的应用。

什么是矩阵?

矩阵是排列成行和列的数字的矩形阵列。具有 m 行和 n 列的矩阵称为 m × n 矩阵。矩阵用大写字母(A、B、C)表示,其各元素用带下标的小写字母表示行列位置,如 a₁₂ 表示第1行第2列的元素。矩阵是线性代数的基础,广泛应用于计算机图形学、机器学习、物理学、经济学和工程学。它们提供了一种紧凑而强大的方式来表示和操作线性方程组、几何变换和多维数据。

矩阵加法和标量乘法

两个矩阵只有在维度相同时才能相加。加法按元素逐一进行:如果 A 和 B 都是 m × n 矩阵,则 (A + B)ᵢⱼ = aᵢⱼ + bᵢⱼ。例如,[[1,2],[3,4]] + [[5,6],[7,8]] = [[6,8],[10,12]]。标量乘法将每个元素乘以一个数:k × A 意味着每个元素 aᵢⱼ 变为 k × aᵢⱼ。例如,3 × [[1,2],[3,4]] = [[3,6],[9,12]]。两种运算都很直接,遵循你在处理单个数字时所期望的规则。减法定义为 A - B = A + (-1)B。

矩阵乘法

矩阵乘法比加法更复杂。要将矩阵 A(m × n)乘以矩阵 B(n × p),结果 C(m × p)的每个元素是 A 的一行与 B 的一列的点积:cᵢⱼ = Σ(aᵢₖ × bₖⱼ),k 从 1 到 n。关键是 A 的列数必须等于 B 的行数。矩阵乘法不满足交换律:AB 通常不等于 BA。例如,[[1,2],[3,4]] × [[5,6],[7,8]] = [[19,22],[43,50]]。尽管复杂,矩阵乘法是线性代数中最重要的运算,支撑从求解方程组到训练神经网络的一切。

行列式

行列式是从方阵计算出的标量值,编码了重要性质。对于 2×2 矩阵 [[a,b],[c,d]],行列式为 ad - bc。对于更大的矩阵,行列式通过余子式展开或行化简计算。行列式有几种关键解释:它代表矩阵定义的线性变换的缩放因子,其绝对值等于矩阵列向量所构成的平行四边形(2×2)或平行六面体(3×3)的面积或体积。行列式为零的矩阵是奇异的(不可逆),意味着其列线性相关,相关的方程组要么没有唯一解,要么有无穷多解。

矩阵的逆

方阵 A 的逆矩阵,记作 A⁻¹,是使得 A × A⁻¹ = A⁻¹ × A = I 的矩阵,其中 I 是单位矩阵(对角线上为 1,其余为 0)。不是每个矩阵都有逆;只有非奇异矩阵(行列式不为零的)才是可逆的。对于 2×2 矩阵 [[a,b],[c,d]],逆矩阵为 (1/(ad-bc)) × [[d,-b],[-c,a]]。对于更大的矩阵,逆可以通过行化简(高斯-约旦消元法)或伴随矩阵公式计算。矩阵逆对于求解方程组(X = A⁻¹ × B)、撤消变换和数值计算中的许多算法都是必不可少的。

用矩阵解方程组

线性方程组可以写成矩阵形式 AX = B,其中 A 是系数矩阵,X 是未知数列向量,B 是常数列向量。如果 A 可逆,唯一解为 X = A⁻¹ × B。或者,高斯消元法将增广矩阵 [A|B] 变换为行阶梯形,然后通过回代读出解。例如,方程组 2x + y = 5,x - y = 1 可以写为 [[2,1],[1,-1]] × [[x],[y]] = [[5],[1]]。系数矩阵的逆给出 x = 2,y = 1。这种矩阵方法可以有效地扩展到具有数百或数千个变量的方程组。

特殊矩阵

几种类型的矩阵具有使其重要的特殊性质。单位矩阵 I 的对角线上为 1,其余全为 0;在乘法中它的作用像数字 1。对角矩阵仅在主对角线上有非零元素,使乘法和求逆非常高效。对称矩阵等于其转置(A = Aᵀ),且对称矩阵的所有特征值都是实数。正交矩阵的逆等于其转置(A⁻¹ = Aᵀ),它保持长度和角度不变,非常适合表示旋转。稀疏矩阵大部分元素为零,使用特殊技术存储和处理以节省内存和计算时间。

矩阵的应用

矩阵在许多领域都不可或缺。在计算机图形学中,4×4 变换矩阵处理 3D 对象的平移、旋转、缩放和透视投影。在机器学习中,神经网络本质上是矩阵乘法链加上非线性激活。在物理学中,量子力学将状态和可观测量表示为矩阵(或向量空间上的算子)。在经济学中,投入产出模型使用矩阵分析产业之间的相互依赖关系。在谷歌的 PageRank 算法中,整个网络被建模为一个巨大的矩阵,页面排名由该矩阵的主特征向量决定。

相关计算器