数据科学- 统计标准差
标准差
标准差是描述观察结果分布程度的数字。
如果观测值为 "spread",则数学函数将难以预测精确值。 标准差是衡量不确定性的指标。
低标准差意味着大多数数字接近平均值。
高标准偏差意味着值分布在更广的范围内。
标准差通常由符号 Sigma 表示: σ
我们可以使用 Numpy 的 std()
函数来查找变量的标准差:
实例
import numpy as np
std = np.std(full_health_data)
print(std)
输出:
这些数字是什么意思?
变异系数
变异系数用于了解标准偏差有多大。
在数学上,变异系数定义为:
变异系数 = 标准差/平均值
如果我们继续下面的代码,我们可以在 Python 中做到这一点:
实例
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
输出:
我们看到变量 Duration、Calorie_Burnage 和 Hours_Work 与 Max_Pulse、Average_Pulse 和 Hours_Sleep 相比具有较高的标准偏差。