统计数据
令人难以置信的巧克力事实
十分之九的人喜欢巧克力。
50% 的美国人口每天都离不开巧克力。
描述性统计
描述性统计是将观察结果汇总为我们可以理解的信息的方法。
由于我们对每个新生儿都进行了登记,因此我们可以看出每 100 个婴儿中有 51 个是男孩。
根据我们收集到的数字,我们可以预测新生儿有 51% 的几率是男孩。
这个比例不是 50%,就像基础生物学预测的那样,这是一个谜。 我们只能说,自 17 世纪以来,我们至少有过这种倾斜的性别比例。
平均值
平均值是所有值的平均值。
此表包含房价与大小:
Price | 7 | 8 | 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
Size | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
平均价格为 (7+8+8+9+9+9+10+11+14+14+15)/11 = 10.363636。
如何:将所有数字相加,然后除以数字的个数。
Mean 是 Sum 除以 Count。
差异
在统计中,方差是与平均值的平方差的平均值。
换句话说,它描述了一组数字与其平均值的距离。
方差(在 JavaScript 中):
// 计算平均值 (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;
// 计算平方和 (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// 计算方差
var variance = ss / 11;
或者如果你使用像 math.js 这样的数学库:
var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");
标准偏差
标准偏差是衡量数字分布程度的指标。
符号是σ(希腊字母sigma)。
公式是√方差(方差的平方根)。
标准偏差是(在 JavaScript 中):
// 计算平均值 (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;
// 计算平方和 (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// 计算方差
var variance = ss / 11;
// 计算标准差
var std = Math.sqrt(variance);
正态分布
正态分布曲线是钟形曲线。
曲线的每个波段都有一个宽度1个标准偏差: