时间序列 - 错误度量
量化模型的性能以将其用作反馈和比较对我们来说很重要。 在本教程中,我们使用了最流行的误差度量均方根误差之一。 还有各种其他可用的错误指标。 本章简要讨论它们。
均方误差
它是预测值和真实值之间差异的平方的平均值。 Sklearn 将其作为函数提供。 它与真实值和预测值的平方具有相同的单位,并且始终为正。
$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$
其中 $y'_{t}$ 是预测值,
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。
从等式中可以清楚地看出,MSE 对较大的错误或异常值的惩罚更大。
均方根误差
它是均方误差的平方根。 它也总是积极的,并且在数据的范围内。
$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$
其中,$y'_{t}$ 是预测值
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。
它具有统一的力量,因此与 MSE 相比更易于解释。 RMSE 对更大的错误也有更多的惩罚。 我们在教程中使用了 RMSE 度量。
平均绝对误差
它是预测值和真实值之间绝对差的平均值。 它具有与预测值和真实值相同的单位,并且始终为正。
$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$
其中,$y'_{t}$ 是预测值,
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。
平均百分比误差
它是预测值和真实值之间绝对差的平均值除以真实值的百分比。
$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$
其中,$y'_{t}$ 是预测值,
$y_{t}$ 是实际值,n 是测试集中值的总数。
但是,使用这种误差的缺点是正误差和负误差可以相互抵消。 因此使用平均绝对百分比误差。
平均绝对百分比误差
它是预测值和真实值之间绝对差的平均值除以真实值的百分比。
$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}*100\: \%$$
其中 $y'_{t}$ 是预测值
$y_{t}$ 是实际值,并且
n 是测试集中值的总数。