数据科学 - 线性函数
数学函数对于数据科学家来说很重要,因为我们想要做出预测并解释它们。
线性函数
在数学中,函数用于将一个变量与另一个变量关联起来。
假设我们考虑卡路里消耗和平均脉搏之间的关系。 可以合理地假设,一般来说,卡路里消耗会随着平均脉搏的变化而变化——我们说卡路里消耗取决于平均脉搏。
此外,可以合理地假设随着平均脉搏增加,卡路里消耗也会增加。 卡路里消耗和平均脉搏是考虑的两个变量。
因为卡路里消耗取决于平均脉搏,所以我们说卡路里消耗是因变量,平均脉搏是自变量。
因变量和自变量之间的关系通常可以使用公式(函数)在数学上表示。
线性函数有一个自变量(x)和一个因变量(y),形式如下:
y = f(x) = ax + b
当我们为自变量选择一个值时,此函数用于计算因变量的值。
解释:
- f(x) = 输出(因变量)
- x = 输入(自变量)
- a = 斜率 = 是自变量的系数。 它给出了因变量的变化率
- b = intercept = 是 x=0 时因变量的值,也是对角线与纵轴相交的点。
具有一个解释变量的线性函数
具有一个解释变量的函数意味着我们使用一个变量进行预测。
假设我们想使用平均脉搏来预测卡路里消耗。 我们有以下公式:
f(x) = 2x + 80
这里,数字和变量的意思是:
- f(x) = 输出。 这个数字就是我们得到卡路里燃烧预测值的地方
- x = 输入,即 Average_Pulse
- 2 = 斜率 = 指定如果 Average_Pulse 增加 1,则 Calorie_Burnage 增加多少。 它告诉我们对角线 "steep" 是怎样的
- 80 = Intercept = 固定值。 当 x = 0 时,它是因变量的值
绘制线性函数
术语线性意味着一个 "直线"。 因此,如果您以图形方式显示线性函数,则该线将始终是一条直线。 该线可以向上、向下倾斜,并且在某些情况下可以是水平的或垂直的。
这是上述数学函数的图形表示:
图表说明:
- 水平轴一般称为x轴。 在这里,它代表 Average_Pulse。
- 纵轴一般称为y轴。 在这里,它代表 Calorie_Burnage。
- Calorie_Burnage 是 Average_Pulse 的函数,因为假设 Calorie_Burnage 依赖于 Average_Pulse。
- 换句话说,我们使用 Average_Pulse 来预测 Calorie_Burnage。
- 蓝色(对角线)线表示预测卡路里消耗的数学函数的结构。