文章 "神经网络变得轻松(第十八部分):关联规则"

 

新文章 神经网络变得轻松(第十八部分):关联规则已发布:

作为本系列文章的延续,我们来研究无监督学习方法中的另一类问题:挖掘关联规则。 这种问题类型首先用于零售业,即超市等,来分析市场篮子。 在本文中,我们将讨论这些算法在交易中的适用性。

该算法从消除随机项开始。 为了做到这一点,与前面的算法一样,我们对整个训练集合执行第一遍,并计算每项的支持率。 之后,删除频率小于 MinSup 的所有项。

其余项按其支持率的降序排列。 上述示例产生以下序列:

D (0.8) -> C (0.7) -> B (0.6) -> E(0.4) 

接下来,我们将拔高 FP 树。 为此,针对训练样本执行第二次验算。 在每笔业务中,我们只获取按支持率降序排列的频繁项,并在树中构建路径。 因此,支持率最高的节点将位于树根处,而支持率最低的节点将为叶片。 我们还为每个节点创建一个计数器。 在第一遍迭代中,我们将计数器值设置为 1(或 1/N,其中 N 是训练样本的尺寸)。

FP 树的第一条路径

作者:Dmitriy Gizlyk