时间序列 - Python 库
由于 Python 易于编写和易于理解的代码结构以及种类繁多的开源库,Python 在执行机器学习的个人中广受欢迎。 下面介绍了我们将在接下来的章节中使用的一些此类开源库。
NumPy
数值 Python 是一个用于科学计算的库。 它适用于 N 维数组对象,并提供基本的数学功能,如大小、形状、平均值、标准差、最小值、最大值以及一些更复杂的函数,如线性代数函数和傅里叶变换。 随着我们在本教程中的推进,您将了解更多有关这些内容的信息。
Pandas
该库提供了高效且易于使用的数据结构,例如系列、数据框和面板。 它增强了 Python 的功能,从单纯的数据收集和准备到数据分析。 Pandas 和 NumPy 这两个库使对小型到大型数据集的任何操作都非常简单。 要了解有关这些功能的更多信息,请遵循本教程。
SciPy
Science Python 是一个用于科学和技术计算的库。 它提供优化、信号和图像处理、积分、插值和线性代数的功能。 这个库在执行机器学习时很方便。 我们将在本教程中继续讨论这些功能。
Scikit Learn
该库是一个广泛用于统计建模、机器学习和深度学习的 SciPy 工具包,因为它包含各种可定制的回归、分类和聚类模型。 它适用于 Numpy、Pandas 和其他库,使其更易于使用。
Statsmodels
与 Scikit Learn 一样,该库用于统计数据探索和统计建模。 它还可以与其他 Python 库很好地配合使用。
Matplotlib
该库用于各种格式的数据可视化,如线图、条形图、热图、散点图、直方图等。它包含从绘图到标记所需的所有与图形相关的功能。 我们将在本教程中继续讨论这些功能。
这些库对于开始使用任何类型的数据进行机器学习非常重要。
除了上面讨论的那些,另一个对处理时间序列特别重要的库是 −
Datetime
这个库,有它的两个模块 − 日期时间和日历,为读取、格式化和操作时间提供所有必要的日期时间功能。
我们将在接下来的章节中使用这些库。