如何计算置信区间

逐步学习计算置信区间。了解何时使用z区间与t区间、如何选择置信水平以及如何解读结果。

什么是置信区间？

置信区间是从样本数据计算出的一个值的范围，该范围可能包含真实的总体参数。与报告单一的点估计（如样本均值）不同，置信区间提供了一个考虑抽样变异性的范围。例如，总体均值的95%置信区间可能是(42.3, 47.7)，意味着基于样本数据，估计真实总体均值位于42.3和47.7之间。区间的宽度反映了估计的精度：越窄的区间表示越精确的估计。

置信水平解释

置信水平，通常为90%、95%或99%，描述如果您重复抽样过程多次，该区间构造方法捕获真实参数的频率。95%的置信水平意味着如果您取100个独立随机样本并从每个样本计算95%置信区间，约95个区间将包含真实的总体参数。这并不意味着真实值有95%的概率位于任何特定区间内。更高的置信水平产生更宽的区间，因为您需要更大的范围来更确定地捕获参数。

Z区间公式

当总体标准差(sigma)已知且样本量较大（通常n >= 30）时，使用z区间公式：CI = x̄ ± z* × (sigma / sqrt(n))。这里x̄是样本均值，z*是所选置信水平的临界z值（90%为1.645，95%为1.96，99%为2.576），sigma是总体标准差，n是样本量。sigma / sqrt(n)这个项称为标准误差，衡量样本均值在样本间预期变化的程度。此公式假设数据来自正态分布总体或样本量足够大以使中心极限定理适用。

T区间公式

当总体标准差未知（这是典型的现实情况）时，用样本标准差s替代sigma，使用t分布而非z分布。公式变为：CI = x̄ ± t* × (s / sqrt(n))，其中t*是自由度为n-1的t分布的临界值。t分布比标准正态分布有更重的尾部，产生略宽的区间以考虑从估计sigma带来的额外不确定性。随着样本量增大，t分布趋近z分布，两种方法之间的差异变得可以忽略。

选择合适的样本量

置信区间的宽度取决于三个因素：置信水平、数据的变异性和样本量。由于您通常无法控制前两个，样本量是控制精度的主要杠杆。误差幅度公式E = z* × (sigma / sqrt(n))可以求解n来找到所需精度的最小样本量：n = (z* × sigma / E)²。例如，要在95%置信下实现2的误差幅度，sigma = 10，需要n = (1.96 × 10 / 2)² = 96.04，即至少97个观测值。

比例的置信区间

估计总体比例（如支持某候选人的选民百分比）时，公式调整为使用比例而非均值。比例的置信区间为：p̂ ± z* × sqrt(p̂ × (1 - p̂) / n)，其中p̂是样本比例，n是样本量。此公式要求n × p̂和n × (1 - p̂)都至少为10，以确保抽样分布近似正态。对于小样本或接近0或1的比例，Wilson区间或Clopper-Pearson区间等替代方法提供更准确的覆盖率。

常见错误和误解

对置信区间最常见的误解是说"真实均值有95%的概率落在这个区间内"。真实参数是一个固定（虽然未知）的值，而非随机变量；随机性在于区间本身。另一个常见错误是在sigma未知时使用z区间，这会低估区间宽度。此外，置信区间假设随机抽样；从有偏或便利样本计算的区间可能不具有所述的覆盖率。最后，不要将置信区间与预测区间混淆，后者估计单个新观测值将落在哪里，总是比置信区间更宽。