XGBoost - 超参数

在本章中，我们将讨论 XGBoost 算法所需的或常用的超参数子集。选择这些参数是为了简化从数据生成模型参数的过程。本章按类别列出了需要配置的超参数。可设置和可选的超参数。

XGBoost 超参数类别

XGBoost 创建者将整体超参数分为三大类 −

让我们在下面的部分讨论这三类超参数 −

常规参数定义了 XGBoost 模型的整体功能和工作原理。以下是此类别中的参数列表 −

增强器 [default=gbtree]:此参数基本上选择每次迭代时要运行的模型类型。它提供了 2 个选项 - gbtree:基于树的模型和 gblinear:线性模型。
silent [default=0]:用于将模型设置为静默模式。如果激活并设置为 1，则表示不会打印任何正在运行的消息。最好将其保留为 0，因为消息可以帮助理解模型。
nthread [默认为可用的最大线程数]:主要用于并行处理，应输入系统中的核心数。如果您想在所有核心上运行，则无需输入该值，算法将自动检测它。

XGBoost 自动设置了另外两个参数，因此您无需担心它们。

由于助推器有两种类型，这里我们只讨论树助推器，因为它比线性助推器使用频率低，并且始终表现更好。

学习任务参数定义优化的目标以及每一步将选择的指标。

用于定义要最小化的损失函数。最常用的值如下 −

评估指标必须与验证数据一起使用。默认参数是用于误差分类和回归的rmse。

典型值如下 −

它是随机数种子。它用于生成可重现的结果，也用于参数调整。

那些以前从未使用过 Scikit-Learn 的人不太可能认识这些参数名称。但是，Python xgboost 包有一个 sklearn 包装器，称为 XGBClassifier 参数。它遵循 sklearn 样式的命名约定。将改变的参数名称是: