Weka - 关联

据观察,购买啤酒的人也会同时购买尿布。也就是说,购买啤酒和尿布之间存在关联。虽然这似乎不太令人信服,但这个关联规则是从超市的庞大数据库中挖掘出来的。同样,花生酱和面包之间也存在关联。

找到这样的关联对于超市来说至关重要,因为他们会把尿布放在啤酒旁边,这样顾客就能轻松找到这两种商品,从而增加超市的销售额。

Apriori 算法是 ML 中的一种算法,它可以找出可能的关联并创建关联规则。WEKA 提供了 Apriori 算法的实现。您可以在计算这些规则时定义最小支持度和可接受的置信度。您将把 Apriori 算法应用于 WEKA 安装中提供的 supermarket 数据。

加载数据

在 WEKA explorer 中,打开 Preprocess 选项卡,单击 Open file ... 按钮,然后从安装文件夹中选择 supermarket.arff 数据库。加载数据后,您将看到以下屏幕 −

Loading Data

数据库包含 4627 个实例和 217 个属性。您可以轻松理解检测如此大量属性之间的关联有多么困难。幸运的是,这项任务在 Apriori 算法的帮助下可以自动完成。

关联器

单击 关联 选项卡,然后单击 选择 按钮。选择 Apriori 关联,如屏幕截图所示 −

关联选项卡

要设置 Apriori 算法的参数,请单击其名称,将弹出一个窗口,如下所示,允许您设置参数 −

Apriori 算法

设置参数后,单击 开始 按钮。过一会儿,您将看到如以下屏幕截图所示的结果 −

Start Parameters

在底部,您将找到检测到的最佳关联规则。这将有助于超市将其产品存放在合适的货架上。