記事「ニューラルネットワークが簡単に(第18部):アソシエーションルール」についてのディスカッション

 

新しい記事「ニューラルネットワークが簡単に(第18部):アソシエーションルール」はパブリッシュされました:

この連載の続きとして、教師なし学習の手法の中で、もう1つのタイプの問題であるアソシエーションルールのマイニングについて考えてみましょう。この問題タイプは、小売業、特にスーパーマーケットで、市場の分類を分析するために最初に使用されました。今回は、このようなアルゴリズムの取引への応用についてお話します。

アルゴリズムは、まずランダムな項目を排除することから始まります。そのために、前のアルゴリズムと同様に、訓練セット全体に対して最初のパスを実行し、各項目の支持度を計算します。その後、頻度がMinSupより小さいものをすべて削除します。

残りの項目は、支持度の高い順に並んでいます。上記の例では、以下のようなシリーズになります。

D (0.8) -> C (0.7) -> B (0.6) -> E(0.4) 

次に、FP-treeを成長させます。そのためには、訓練標本に対して2回目のパスを実行します。各トランザクションでは、支持度の降順に並べられた頻出項目のみを取り出し、木に経路を構築します。したがって、支持度の最も高いノードは木の根に、最も低いノードは葉になります。また、各ノードに対してカウンタを作成します。最初の反復では,カウンタ値を1(または1/N,Nは訓練標本の大きさ)に等しくします。

FP-treeの最初の経路

作者: Dmitriy Gizlyk