Weka - 启动 Explorer

在本章中,让我们了解一下 Explorer 为处理大数据提供的各种功能。

单击 Applications 选择器中的 Explorer 按钮时,会打开以下屏幕 −

Explorer Button

在顶部,您将看到此处列出的几个选项卡 −

  • 预处理
  • 分类
  • 集群
  • 关联
  • 选择属性
  • 可视化

在这些选项卡下,有几种预先实现的机器学习算法。现在让我们详细研究一下它们。

预处理选项卡

最初打开资源管理器时,仅启用预处理选项卡。机器学习的第一步是预处理数据。因此,在预处理选项中,您将选择数据文件,对其进行处理并使其适合应用各种机器学习算法。

分类选项卡

分类选项卡为您提供了几种机器学习算法来对数据进行分类。列举几个,您可以应用诸如线性回归、逻辑回归、支持向量机、决策树、随机树、随机森林、朴素贝叶斯等算法。该列表非常详尽,提供了监督和无监督的机器学习算法。

Cluster 选项卡

Cluster 选项卡下,提供了几种聚类算法 - 例如 SimpleKMeans、FilteredClusterer、HierarchicalClusterer 等。

Associate 选项卡

Associate 选项卡下,您将找到 Apriori、FilteredAssociator 和 FPGrowth。

Select Attributes 选项卡

Select Attributes 允许您根据多种算法(例如 ClassifierSubsetEval、PrinicipalComponents 等)进行功能选择。

Visualize 选项卡

最后,Visualize 选项允许您可视化处理后的数据以进行分析。

正如您所注意到的, WEKA 提供了几种现成的算法,用于测试和构建机器学习应用程序。要有效地使用 WEKA,您必须充分了解这些算法、它们的工作原理、在什么情况下选择哪种算法、在处理的输出中寻找什么等等。简而言之,您必须具备扎实的机器学习基础,才能有效地使用 WEKA 构建应用程序。

在接下来的章节中,您将深入研究资源管理器中的每个选项卡。