Weka - 启动 Explorer
在本章中,让我们了解一下 Explorer 为处理大数据提供的各种功能。
单击 Applications 选择器中的 Explorer 按钮时,会打开以下屏幕 −
在顶部,您将看到此处列出的几个选项卡 −
- 预处理
- 分类
- 集群
- 关联
- 选择属性
- 可视化
在这些选项卡下,有几种预先实现的机器学习算法。现在让我们详细研究一下它们。
预处理选项卡
最初打开资源管理器时,仅启用预处理选项卡。机器学习的第一步是预处理数据。因此,在预处理选项中,您将选择数据文件,对其进行处理并使其适合应用各种机器学习算法。
分类选项卡
分类选项卡为您提供了几种机器学习算法来对数据进行分类。列举几个,您可以应用诸如线性回归、逻辑回归、支持向量机、决策树、随机树、随机森林、朴素贝叶斯等算法。该列表非常详尽,提供了监督和无监督的机器学习算法。
Cluster 选项卡
在 Cluster 选项卡下,提供了几种聚类算法 - 例如 SimpleKMeans、FilteredClusterer、HierarchicalClusterer 等。
Associate 选项卡
在 Associate 选项卡下,您将找到 Apriori、FilteredAssociator 和 FPGrowth。
Select Attributes 选项卡
Select Attributes 允许您根据多种算法(例如 ClassifierSubsetEval、PrinicipalComponents 等)进行功能选择。
Visualize 选项卡
最后,Visualize 选项允许您可视化处理后的数据以进行分析。
正如您所注意到的, WEKA 提供了几种现成的算法,用于测试和构建机器学习应用程序。要有效地使用 WEKA,您必须充分了解这些算法、它们的工作原理、在什么情况下选择哪种算法、在处理的输出中寻找什么等等。简而言之,您必须具备扎实的机器学习基础,才能有效地使用 WEKA 构建应用程序。
在接下来的章节中,您将深入研究资源管理器中的每个选项卡。