文章 "神经网络变得轻松（第十八部分）：关联规则"

MetaQuotes 2022.09.20 08:42

作为本系列文章的延续，我们来研究无监督学习方法中的另一类问题：挖掘关联规则。这种问题类型首先用于零售业，即超市等，来分析市场篮子。在本文中，我们将讨论这些算法在交易中的适用性。

该算法从消除随机项开始。为了做到这一点，与前面的算法一样，我们对整个训练集合执行第一遍，并计算每项的支持率。之后，删除频率小于 MinSup 的所有项。

其余项按其支持率的降序排列。上述示例产生以下序列：

D (0.8) -> C (0.7) -> B (0.6) -> E(0.4)

接下来，我们将拔高 FP 树。为此，针对训练样本执行第二次验算。在每笔业务中，我们只获取按支持率降序排列的频繁项，并在树中构建路径。因此，支持率最高的节点将位于树根处，而支持率最低的节点将为叶片。我们还为每个节点创建一个计数器。在第一遍迭代中，我们将计数器值设置为 1（或 1/N，其中 N 是训练样本的尺寸）。

FP 树的第一条路径

作者：Dmitriy Gizlyk

新评论