
标准差(Standard Deviation,简称STD)的计算公式
标准差是统计学中用于衡量数据分布离散程度的一个重要指标。它反映了数据集中各个数值与平均值之间的偏差大小。标准差的计算公式有两种形式:总体标准差和样本标准差。以下是这两种形式的详细解释及公式推导。
一、总体标准差
当我们要计算的数据集代表整个研究对象的全部数据时,我们使用总体标准差。
定义:总体标准差是描述整个数据集波动大小的统计量。
公式: [ \sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2} ] 其中:
- $\sigma$ 是总体标准差;
- $N$ 是数据的总数;
- $x_i$ 是每一个具体的观测值;
- $\mu$ 是数据的平均值,计算公式为 $\mu = \frac{1}{N}\sum_{i=1}^{N}x_i$。
步骤:
- 计算数据的平均值 $\mu$;
- 对每个数据点 $x_i$,计算其与平均值的差 $(x_i - \mu)$;
- 将这些差值平方并求和;
- 用这个和除以数据的个数 $N$ 得到方差;
- 对方差开平方得到标准差。
二、样本标准差
当我们从研究对象中抽取一部分数据进行研究时,我们使用样本标准差。由于样本只是总体的一部分,因此样本标准差的计算方法需要稍作调整,以反映这种不确定性。
定义:样本标准差是描述样本数据波动大小的统计量,用于估计总体的标准差。
公式: [ s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2} ] 其中:
- $s$ 是样本标准差;
- $n$ 是样本的容量(即样本中包含的数据个数);
- $x_i$ 是每一个具体的观测值;
- $\bar{x}$ 是样本的平均值,计算公式为 $\bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i$。
注意:在样本标准差的计算中,分母使用的是 $n-1$ 而不是 $n$,这是为了修正由于样本容量有限而导致的偏差,这种方法称为贝塞尔校正(Bessel's correction)。
步骤:
- 计算样本的平均值 $\bar{x}$;
- 对每个数据点 $x_i$,计算其与样本平均值的差 $(x_i - \bar{x})$;
- 将这些差值平方并求和;
- 用这个和除以 $n-1$ 得到样本方差;
- 对样本方差开平方得到样本标准差。
通过了解和应用上述两种标准差的计算公式,我们可以更好地理解和分析数据的分布情况及其变异程度。
