如何计算均值、中位数和众数——完全指南

学习如何计算均值、中位数和众数，附有清晰的解释和示例。了解何时使用每种集中趋势度量。

什么是集中趋势度量？

集中趋势度量是代表数据集"中心"或"典型值"的数值。三种最常见的度量是均值、中位数和众数。每种都从不同角度捕捉数据的"平均"或"代表性"特征。选择正确的度量取决于数据的分布和你试图回答的问题。在完美对称的分布中，三种度量相等，但在偏斜或不规则的数据中，它们可能显著不同，每种都讲述了关于数据的不同故事。

计算均值（平均值）

算术均值就是大多数人所说的"平均值"。计算方法是将数据集中的所有值相加，然后除以值的个数。公式为：均值 = 所有值之和 / n。例如，{5, 10, 15, 20, 25} 的均值为 (5 + 10 + 15 + 20 + 25) / 5 = 75 / 5 = 15。均值考虑了每一个值，这使它对异常值很敏感。一个极大或极小的值可以将均值显著拉离大多数数据的位置。例如，{10, 12, 11, 13, 100} 的均值为 29.2，尽管五个值中有四个接近 12。

计算中位数

中位数是数据按从小到大排列后的中间值。如果数据集有奇数个值，中位数就是中间那个值。如果有偶数个值，中位数是中间两个值的平均数。例如，{3, 7, 9, 12, 15} 的中位数是 9（五个值中的第三个）。{3, 7, 9, 12} 的中位数是 (7 + 9) / 2 = 8（第二个和第三个值的平均数）。中位数不受异常值的影响，这使它对偏斜数据特别有用。例如，家庭收入中位数比平均家庭收入更受青睐，因为少数亿万富翁会大幅拉高均值。

计算众数

众数是数据集中出现次数最多的值。数据集可以有一个众数（单峰）、两个众数（双峰）、多个众数（多峰），或者没有众数（每个值出现次数相同）。例如，{2, 3, 3, 5, 7, 7, 7, 10} 的众数是 7，因为它出现了三次，比其他任何值都多。众数是唯一可以用于分类（非数值）数据的集中趋势度量。例如，最喜欢的颜色列表的众数可能是"蓝色"。当你想知道最常见的值时，众数最有用。

何时使用每种度量

当数据大致对称且没有极端异常值时使用均值，因为它使用了所有可用信息。当数据偏斜或包含异常值时使用中位数，因为它能更好地反映典型值。当你想识别最常见的类别或值时使用众数，特别是对于离散或分类数据。在房地产中，中位数房价比均值更受青睐，因为豪宅会向上扭曲平均值。在服装行业，众数鞋码帮助零售商了解应该多备哪些尺码。在分布对称的考试评分中，均值是最具信息量的汇总统计量。

加权平均

加权平均为数据集中的每个值赋予不同的重要性。每个值不是被同等对待，而是乘以一个权重，然后将加权值之和除以权重之和。公式为：加权平均 = Σ(权重ᵢ × 值ᵢ) / Σ(权重ᵢ)。例如，如果期末成绩由作业（30%）、期中考试（30%）和期末考试（40%）组成，而你分别得了 90、80 和 70 分，则加权平均为 (0.30 × 90 + 0.30 × 80 + 0.40 × 70) / 1.00 = (27 + 24 + 28) / 1 = 79。加权平均在学业评分、金融指数和调查分析中是标准方法。

均值、中位数和众数之间的关系

在完美对称的分布中（如正态分布），均值、中位数和众数都相等。在右偏分布中（有一条向右延伸的长尾），均值被拉向右边，大于中位数，中位数又大于众数。在左偏分布中，顺序相反：均值最小，其次是中位数，然后是众数。对于中等偏斜的数据，有一个近似的经验关系：均值 - 众数 ≈ 3 ×（均值 - 中位数）。理解这种关系有助于你仅凭汇总统计量就推断分布的形状。