Weka - 关联
据观察,购买啤酒的人也会同时购买尿布。也就是说,购买啤酒和尿布之间存在关联。虽然这似乎不太令人信服,但这个关联规则是从超市的庞大数据库中挖掘出来的。同样,花生酱和面包之间也存在关联。
找到这样的关联对于超市来说至关重要,因为他们会把尿布放在啤酒旁边,这样顾客就能轻松找到这两种商品,从而增加超市的销售额。
Apriori 算法是 ML 中的一种算法,它可以找出可能的关联并创建关联规则。WEKA 提供了 Apriori 算法的实现。您可以在计算这些规则时定义最小支持度和可接受的置信度。您将把 Apriori 算法应用于 WEKA 安装中提供的 supermarket 数据。
加载数据
在 WEKA explorer 中,打开 Preprocess 选项卡,单击 Open file ... 按钮,然后从安装文件夹中选择 supermarket.arff 数据库。加载数据后,您将看到以下屏幕 −
数据库包含 4627 个实例和 217 个属性。您可以轻松理解检测如此大量属性之间的关联有多么困难。幸运的是,这项任务在 Apriori 算法的帮助下可以自动完成。
关联器
单击 关联 选项卡,然后单击 选择 按钮。选择 Apriori 关联,如屏幕截图所示 −
要设置 Apriori 算法的参数,请单击其名称,将弹出一个窗口,如下所示,允许您设置参数 −
设置参数后,单击 开始 按钮。过一会儿,您将看到如以下屏幕截图所示的结果 −
在底部,您将找到检测到的最佳关联规则。这将有助于超市将其产品存放在合适的货架上。