STD的计算公式

STD的计算公式

标准差(Standard Deviation,简称STD)的计算公式

标准差是统计学中用于衡量数据分布离散程度的一个重要指标。它反映了数据集中各个数值与平均值之间的偏差大小。标准差的计算公式有两种形式:总体标准差和样本标准差。以下是这两种形式的详细解释及公式推导。

一、总体标准差

当我们要计算的数据集代表整个研究对象的全部数据时,我们使用总体标准差。

  1. 定义:总体标准差是描述整个数据集波动大小的统计量。

  2. 公式: [ \sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2} ] 其中:

    • $\sigma$ 是总体标准差;
    • $N$ 是数据的总数;
    • $x_i$ 是每一个具体的观测值;
    • $\mu$ 是数据的平均值,计算公式为 $\mu = \frac{1}{N}\sum_{i=1}^{N}x_i$。
  3. 步骤

    • 计算数据的平均值 $\mu$;
    • 对每个数据点 $x_i$,计算其与平均值的差 $(x_i - \mu)$;
    • 将这些差值平方并求和;
    • 用这个和除以数据的个数 $N$ 得到方差;
    • 对方差开平方得到标准差。

二、样本标准差

当我们从研究对象中抽取一部分数据进行研究时,我们使用样本标准差。由于样本只是总体的一部分,因此样本标准差的计算方法需要稍作调整,以反映这种不确定性。

  1. 定义:样本标准差是描述样本数据波动大小的统计量,用于估计总体的标准差。

  2. 公式: [ s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2} ] 其中:

    • $s$ 是样本标准差;
    • $n$ 是样本的容量(即样本中包含的数据个数);
    • $x_i$ 是每一个具体的观测值;
    • $\bar{x}$ 是样本的平均值,计算公式为 $\bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i$。
  3. 注意:在样本标准差的计算中,分母使用的是 $n-1$ 而不是 $n$,这是为了修正由于样本容量有限而导致的偏差,这种方法称为贝塞尔校正(Bessel's correction)。

  4. 步骤

    • 计算样本的平均值 $\bar{x}$;
    • 对每个数据点 $x_i$,计算其与样本平均值的差 $(x_i - \bar{x})$;
    • 将这些差值平方并求和;
    • 用这个和除以 $n-1$ 得到样本方差;
    • 对样本方差开平方得到样本标准差。

通过了解和应用上述两种标准差的计算公式,我们可以更好地理解和分析数据的分布情况及其变异程度。