数据科学- 统计标准差

标准差

标准差是描述观察结果分布程度的数字。

Standard Deviation

如果观测值为 "spread",则数学函数将难以预测精确值。 标准差是衡量不确定性的指标。

低标准差意味着大多数数字接近平均值。

高标准偏差意味着值分布在更广的范围内。

标准差通常由符号 Sigma 表示: σ

我们可以使用 Numpy 的 std() 函数来查找变量的标准差:

实例

import numpy as np

std = np.std(full_health_data)
print(std)

输出:

Standard Deviation

这些数字是什么意思?


变异系数

变异系数用于了解标准偏差有多大。

在数学上,变异系数定义为:

变异系数 = 标准差/平均值

如果我们继续下面的代码,我们可以在 Python 中做到这一点:

实例

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

输出:

Coefficient of Variation

我们看到变量 Duration、Calorie_Burnage 和 Hours_Work 与 Max_Pulse、Average_Pulse 和 Hours_Sleep 相比具有较高的标准偏差。