样本方差是衡量一组数据离散程度的统计指标,用于衡量数据点与数据集均值之间的差异。计算样本方差的步骤如下:
计算样本均值 :首先,需要计算所有样本数据的平均值,记为 $\bar{x}$。计算每个数据点与样本均值的差值:
对于每个数据点 $x_i$,计算其与样本均值 $\bar{x}$ 的差值,并将这些差值平方。
求和:
将所有差值平方后的结果相加,得到一个总和 $S^2$。
除以 $n-1$:
将总和 $S^2$ 除以样本数量 $n$ 减去 1,即 $n-1$,得到样本方差 $S^2$。
数学公式可以表示为:
$$S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2$$
其中:
$S^2$ 代表样本方差,
$x_i$ 代表每个数据点,
$\bar{x}$ 代表样本均值,
$n$ 代表样本数量。
示例
假设有一组样本数据:$$[12, 15, 18, 20, 22]$$
计算样本均值
$$\bar{x} = \frac{12 + 15 + 18 + 20 + 22}{5} = \frac{87}{5} = 17.4$$
计算每个数据点与样本均值的差值并平方
$$(12 - 17.4)^2 = (-5.4)^2 = 29.16$$
$$(15 - 17.4)^2 = (-2.4)^2 = 5.76$$
$$(18 - 17.4)^2 = (0.6)^2 = 0.36$$
$$(20 - 17.4)^2 = (2.6)^2 = 6.76$$
$$(22 - 17.4)^2 = (4.6)^2 = 21.16$$
求和
$$29.16 + 5.76 + 0.36 + 6.76 + 21.16 = 63.2$$
除以 $n-1$
$$S^2 = \frac{63.2}{5 - 1} = \frac{63.2}{4} = 15.8$$
因此,这组样本数据的样本方差为 15.8。
使用 Python 计算样本方差
在 Python 中,可以使用 `statistics` 模块来计算样本方差。示例代码如下:
```python
import statistics
样本数据
data = [12, 15, 18, 20, 22]
计算样本方差
sample_variance = statistics.variance(data)
print("样本方差:", sample_variance)
```
这段代码将输出样本方差的结果。