矩阵入门——完全指南

学习矩阵基础知识，包括矩阵表示法、运算、行列式、逆矩阵及在方程组、变换和数据科学中的应用。

什么是矩阵？

矩阵是排列成行和列的数字的矩形阵列。具有 m 行和 n 列的矩阵称为 m × n 矩阵。矩阵用大写字母（A、B、C）表示，其各元素用带下标的小写字母表示行列位置，如 a₁₂ 表示第1行第2列的元素。矩阵是线性代数的基础，广泛应用于计算机图形学、机器学习、物理学、经济学和工程学。它们提供了一种紧凑而强大的方式来表示和操作线性方程组、几何变换和多维数据。

矩阵加法和标量乘法

两个矩阵只有在维度相同时才能相加。加法按元素逐一进行：如果 A 和 B 都是 m × n 矩阵，则 (A + B)ᵢⱼ = aᵢⱼ + bᵢⱼ。例如，[[1,2],[3,4]] + [[5,6],[7,8]] = [[6,8],[10,12]]。标量乘法将每个元素乘以一个数：k × A 意味着每个元素 aᵢⱼ 变为 k × aᵢⱼ。例如，3 × [[1,2],[3,4]] = [[3,6],[9,12]]。两种运算都很直接，遵循你在处理单个数字时所期望的规则。减法定义为 A - B = A + (-1)B。

矩阵乘法

矩阵乘法比加法更复杂。要将矩阵 A（m × n）乘以矩阵 B（n × p），结果 C（m × p）的每个元素是 A 的一行与 B 的一列的点积：cᵢⱼ = Σ(aᵢₖ × bₖⱼ)，k 从 1 到 n。关键是 A 的列数必须等于 B 的行数。矩阵乘法不满足交换律：AB 通常不等于 BA。例如，[[1,2],[3,4]] × [[5,6],[7,8]] = [[19,22],[43,50]]。尽管复杂，矩阵乘法是线性代数中最重要的运算，支撑从求解方程组到训练神经网络的一切。

行列式

行列式是从方阵计算出的标量值，编码了重要性质。对于 2×2 矩阵 [[a,b],[c,d]]，行列式为 ad - bc。对于更大的矩阵，行列式通过余子式展开或行化简计算。行列式有几种关键解释：它代表矩阵定义的线性变换的缩放因子，其绝对值等于矩阵列向量所构成的平行四边形（2×2）或平行六面体（3×3）的面积或体积。行列式为零的矩阵是奇异的（不可逆），意味着其列线性相关，相关的方程组要么没有唯一解，要么有无穷多解。

矩阵的逆

方阵 A 的逆矩阵，记作 A⁻¹，是使得 A × A⁻¹ = A⁻¹ × A = I 的矩阵，其中 I 是单位矩阵（对角线上为 1，其余为 0）。不是每个矩阵都有逆；只有非奇异矩阵（行列式不为零的）才是可逆的。对于 2×2 矩阵 [[a,b],[c,d]]，逆矩阵为 (1/(ad-bc)) × [[d,-b],[-c,a]]。对于更大的矩阵，逆可以通过行化简（高斯-约旦消元法）或伴随矩阵公式计算。矩阵逆对于求解方程组（X = A⁻¹ × B）、撤消变换和数值计算中的许多算法都是必不可少的。

用矩阵解方程组

线性方程组可以写成矩阵形式 AX = B，其中 A 是系数矩阵，X 是未知数列向量，B 是常数列向量。如果 A 可逆，唯一解为 X = A⁻¹ × B。或者，高斯消元法将增广矩阵 [A|B] 变换为行阶梯形，然后通过回代读出解。例如，方程组 2x + y = 5，x - y = 1 可以写为 [[2,1],[1,-1]] × [[x],[y]] = [[5],[1]]。系数矩阵的逆给出 x = 2，y = 1。这种矩阵方法可以有效地扩展到具有数百或数千个变量的方程组。

特殊矩阵

几种类型的矩阵具有使其重要的特殊性质。单位矩阵 I 的对角线上为 1，其余全为 0；在乘法中它的作用像数字 1。对角矩阵仅在主对角线上有非零元素，使乘法和求逆非常高效。对称矩阵等于其转置（A = Aᵀ），且对称矩阵的所有特征值都是实数。正交矩阵的逆等于其转置（A⁻¹ = Aᵀ），它保持长度和角度不变，非常适合表示旋转。稀疏矩阵大部分元素为零，使用特殊技术存储和处理以节省内存和计算时间。

矩阵的应用

矩阵在许多领域都不可或缺。在计算机图形学中，4×4 变换矩阵处理 3D 对象的平移、旋转、缩放和透视投影。在机器学习中，神经网络本质上是矩阵乘法链加上非线性激活。在物理学中，量子力学将状态和可观测量表示为矩阵（或向量空间上的算子）。在经济学中，投入产出模型使用矩阵分析产业之间的相互依赖关系。在谷歌的 PageRank 算法中，整个网络被建模为一个巨大的矩阵，页面排名由该矩阵的主特征向量决定。