数据科学- 统计学简介
统计简介
统计是分析数据的科学。
创建预测模型后,我们必须评估预测的可靠性。
毕竟,如果我们不能依赖预测,那么它有什么价值呢?
描述性统计
我们将首先介绍一些基本的描述性统计数据。
描述性统计总结了数据集的重要特征,例如:
- 计数
- 总和
- 标准偏差
- 百分位数
- 平均
- 等等。
这是熟悉数据的良好起点。
我们可以使用 Python 中的 describe()
函数对数据进行汇总:
实例
print (full_health_data.describe())
Output:
你在这里看到了什么有趣的东西吗?