如何计算均值、中位数和众数——完全指南

学习如何计算均值、中位数和众数,附有清晰的解释和示例。了解何时使用每种集中趋势度量。

什么是集中趋势度量?

集中趋势度量是代表数据集"中心"或"典型值"的数值。三种最常见的度量是均值、中位数和众数。每种都从不同角度捕捉数据的"平均"或"代表性"特征。选择正确的度量取决于数据的分布和你试图回答的问题。在完美对称的分布中,三种度量相等,但在偏斜或不规则的数据中,它们可能显著不同,每种都讲述了关于数据的不同故事。

计算均值(平均值)

算术均值就是大多数人所说的"平均值"。计算方法是将数据集中的所有值相加,然后除以值的个数。公式为:均值 = 所有值之和 / n。例如,{5, 10, 15, 20, 25} 的均值为 (5 + 10 + 15 + 20 + 25) / 5 = 75 / 5 = 15。均值考虑了每一个值,这使它对异常值很敏感。一个极大或极小的值可以将均值显著拉离大多数数据的位置。例如,{10, 12, 11, 13, 100} 的均值为 29.2,尽管五个值中有四个接近 12。

计算中位数

中位数是数据按从小到大排列后的中间值。如果数据集有奇数个值,中位数就是中间那个值。如果有偶数个值,中位数是中间两个值的平均数。例如,{3, 7, 9, 12, 15} 的中位数是 9(五个值中的第三个)。{3, 7, 9, 12} 的中位数是 (7 + 9) / 2 = 8(第二个和第三个值的平均数)。中位数不受异常值的影响,这使它对偏斜数据特别有用。例如,家庭收入中位数比平均家庭收入更受青睐,因为少数亿万富翁会大幅拉高均值。

计算众数

众数是数据集中出现次数最多的值。数据集可以有一个众数(单峰)、两个众数(双峰)、多个众数(多峰),或者没有众数(每个值出现次数相同)。例如,{2, 3, 3, 5, 7, 7, 7, 10} 的众数是 7,因为它出现了三次,比其他任何值都多。众数是唯一可以用于分类(非数值)数据的集中趋势度量。例如,最喜欢的颜色列表的众数可能是"蓝色"。当你想知道最常见的值时,众数最有用。

何时使用每种度量

当数据大致对称且没有极端异常值时使用均值,因为它使用了所有可用信息。当数据偏斜或包含异常值时使用中位数,因为它能更好地反映典型值。当你想识别最常见的类别或值时使用众数,特别是对于离散或分类数据。在房地产中,中位数房价比均值更受青睐,因为豪宅会向上扭曲平均值。在服装行业,众数鞋码帮助零售商了解应该多备哪些尺码。在分布对称的考试评分中,均值是最具信息量的汇总统计量。

加权平均

加权平均为数据集中的每个值赋予不同的重要性。每个值不是被同等对待,而是乘以一个权重,然后将加权值之和除以权重之和。公式为:加权平均 = Σ(权重ᵢ × 值ᵢ) / Σ(权重ᵢ)。例如,如果期末成绩由作业(30%)、期中考试(30%)和期末考试(40%)组成,而你分别得了 90、80 和 70 分,则加权平均为 (0.30 × 90 + 0.30 × 80 + 0.40 × 70) / 1.00 = (27 + 24 + 28) / 1 = 79。加权平均在学业评分、金融指数和调查分析中是标准方法。

均值、中位数和众数之间的关系

在完美对称的分布中(如正态分布),均值、中位数和众数都相等。在右偏分布中(有一条向右延伸的长尾),均值被拉向右边,大于中位数,中位数又大于众数。在左偏分布中,顺序相反:均值最小,其次是中位数,然后是众数。对于中等偏斜的数据,有一个近似的经验关系:均值 - 众数 ≈ 3 ×(均值 - 中位数)。理解这种关系有助于你仅凭汇总统计量就推断分布的形状。

相关计算器