时间序列 - 参数校准

简介

任何统计或机器学习模型都有一些参数,这些参数会极大地影响数据的建模方式。 例如,ARIMA 具有 p、d、q 值。 这些参数的确定应使实际值和模型值之间的误差最小。 参数校准被认为是模型拟合中最关键和最耗时的任务。 因此,选择最优参数对我们来说非常重要。


参数校准方法

有多种方法可以校准参数。 本节将详细讨论其中的一些。

Hit-and-try

校准模型的一种常见方法是手动校准,您首先将时间序列可视化,然后直观地尝试一些参数值并一遍又一遍地更改它们,直到获得足够好的拟合。 这需要对我们正在尝试的模型有很好的理解。 对于 ARIMA 模型,手动校准是在"p"参数的自相关图、"q"参数的部分自相关图和 ADF 测试的帮助下完成的,以确认时间序列的平稳性并设置"d"参数 . 我们将在接下来的章节中详细讨论所有这些。

网格搜索

校准模型的另一种方法是通过网格搜索,这实质上意味着您尝试为所有可能的参数组合构建模型并选择具有最小误差的模型。 这是耗时的,因此当要校准的参数数量和它们采用的值范围较少时很有用,因为这涉及到多个嵌套的 for 循环。

遗传算法

遗传算法根据生物学原理工作,即一个好的解决方案最终会演变为最"最优"的解决方案。 它利用变异、交叉和选择的生物学操作,最终达到最优解。

如需进一步了解,您可以阅读其他参数优化技术,如贝叶斯优化和 Swarm 优化。