数据科学函数
本章展示了使用数据科学时的三个常用函数:max()、min() 和 mean()。
运动手表数据集
Duration | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
上面的数据集由 6 个变量组成,每个变量有 10 个观察值:
- Duration - 培训课程持续了多长时间(以分钟计)?
- Average_Pulse - 训练课的平均脉搏是多少? 这是以每分钟的心跳次数来衡量的
- Max_Pulse - 训练课的最大脉搏是多少?
- Calorie_Burnage - 训练期间消耗了多少卡路里?
- Hours_Work - 在培训课程之前我们工作了多少小时?
- Hours_Sleep - 训练前一晚我们睡了多久?
我们使用下划线 (_) 来分隔字符串,因为 Python 无法读取空格作为分隔符。
max() 函数
Python max()
函数用于查找数组中的最大值。
实例
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
亲自试一试 »
min() 函数
Python min()
函数用于查找数组中的最小值。
实例
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
亲自试一试 »
mean() 函数
NumPy mean()
函数用于求数组的平均值。
实例
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
亲自试一试 »
我们在 mean 前面写 np. 是为了让 Python 知道我们要激活 Numpy 库中的 mean 函数。