ハイリー・テクレセラセ
大規模なトランザクション データベースからの高ユーティリティ アイテムセット マイニング (HUIM) は、トランザクションで購入されたアイテムの収益を計算できるため、大きな注目を集めています。HUI をマイニングするほとんどのツリー ベース アルゴリズムは、データベースをアイテム プレフィックス ツリーに変換しますが、見込みのないアイテムを破棄し、大量のメモリを消費します。トランザクション レベルの情報を格納するツリーを使用すると、このようなプレフィックス ツリーと組み合わせてマイニング プロセスが強化されることが証明されています。この点で、本研究では、メモリ効率の高いツリー、つまりユーティリティ プライム ツリー (UPT)、プライム カンター関数ツリー (PCFT)、および文字列ベースのユーティリティ プライム ツリー (SUPT) を提案します。これらは、単一のデータベース スキャンによるプレフィックス ベースのツリーとは異なり、ノードにトランザクション情報全体をエンコードします。実際のデータセットと合成データセットの両方で実施された実験では、これらの構造は、文献のツリー構造と比較してメモリ消費量が大幅に少ないことが示されています。