数据科学 - 线性函数

数学函数对于数据科学家来说很重要,因为我们想要做出预测并解释它们。


线性函数

在数学中,函数用于将一个变量与另一个变量关联起来。

假设我们考虑卡路里消耗和平均脉搏之间的关系。 可以合理地假设,一般来说,卡路里消耗会随着平均脉搏的变化而变化——我们说卡路里消耗取决于平均脉搏。

此外,可以合理地假设随着平均脉搏增加,卡路里消耗也会增加。 卡路里消耗和平均脉搏是考虑的两个变量。

因为卡路里消耗取决于平均脉搏,所以我们说卡路里消耗是因变量,平均脉搏是自变量。

因变量和自变量之间的关系通常可以使用公式(函数)在数学上表示。

线性函数有一个自变量(x)和一个因变量(y),形式如下:

y = f(x) = ax + b

当我们为自变量选择一个值时,此函数用于计算因变量的值。

解释:

  • f(x) = 输出(因变量)
  • x = 输入(自变量)
  • a = 斜率 = 是自变量的系数。 它给出了因变量的变化率
  • b = intercept = 是 x=0 时因变量的值,也是对角线与纵轴相交的点。


具有一个解释变量的线性函数

具有一个解释变量的函数意味着我们使用一个变量进行预测。

假设我们想使用平均脉搏来预测卡路里消耗。 我们有以下公式:

f(x) = 2x + 80

这里,数字和变量的意思是:

  • f(x) = 输出。 这个数字就是我们得到卡路里燃烧预测值的地方
  • x = 输入,即 Average_Pulse
  • 2 = 斜率 = 指定如果 Average_Pulse 增加 1,则 Calorie_Burnage 增加多少。 它告诉我们对角线 "steep" 是怎样的
  • 80 = Intercept = 固定值。 当 x = 0 时,它是因变量的值

绘制线性函数

术语线性意味着一个 "直线"。 因此,如果您以图形方式显示线性函数,则该线将始终是一条直线。 该线可以向上、向下倾斜,并且在某些情况下可以是水平的或垂直的。

这是上述数学函数的图形表示:

Linear function

图表说明:

  • 水平轴一般称为x轴。 在这里,它代表 Average_Pulse。
  • 纵轴一般称为y轴。 在这里,它代表 Calorie_Burnage。
  • Calorie_Burnage 是 Average_Pulse 的函数,因为假设 Calorie_Burnage 依赖于 Average_Pulse。
  • 换句话说,我们使用 Average_Pulse 来预测 Calorie_Burnage。
  • 蓝色(对角线)线表示预测卡路里消耗的数学函数的结构。