什么是 Weka?
WEKA - 一款开源软件,提供数据预处理工具、多种机器学习算法的实现和可视化工具,以便您可以开发机器学习技术并将其应用于现实世界的数据挖掘问题。下图总结了 WEKA 提供的功能 −
如果您观察图像流的开头,您将了解处理大数据有许多阶段,以使其适合机器学习 −
首先,您将从从现场收集的原始数据开始。这些数据可能包含几个空值和不相关的字段。您可以使用 WEKA 提供的数据预处理工具来清理数据。
然后,您将预处理后的数据保存在本地存储中,以便应用 ML 算法。
接下来,根据您尝试开发的 ML 模型类型,您可以选择以下选项之一,例如 分类、聚类 或 关联。属性选择 允许自动选择特征以创建精简的数据集。
请注意,在每个类别下,WEKA 都提供了几种算法的实现。您可以选择一种算法,设置所需的参数并在数据集上运行它。
然后,WEKA 会为您提供模型处理的统计输出。它为您提供了一个可视化工具来检查数据。
各种模型可以应用于同一数据集。然后,您可以比较不同模型的输出,并选择最符合您目的的模型。
因此,使用 WEKA 可以整体上更快地开发机器学习模型。
现在我们已经了解了 WEKA 是什么以及它的作用,在下一章中,让我们学习如何在本地计算机上安装 WEKA。