2017-08-09 19 views
0

私はArulesを使用してRでAproriアルゴリズムを実行しています。私は大量のデータを採掘しており、可能な限りサンプルを使用したくはありません。私は本当に非常に頻繁に販売されていないアイテムに関連するルールを見る必要があります。Arules、範囲内でのサポート

今使っているコードは:

basket_rules < - アプリオリ(データ、パラメータ=リスト(SUP = 0.7、CONF = 0.2、ターゲット= "ルール"、リスト(MINLEN = 4、MAXLEN = 7))

私はデータのサイズと性質のため、低いサポートを必要とします.07より小さくすることはできません。 メモリを節約するためにサポートの範囲を返すことは可能ですか。

たとえば、次のようなものがあります。list(sup < = .05および> = 0001)

Aproriの実行中にメモリ使用を制限するための他のアイデアは本当に感謝しています。

答えて

1

サポートの性質(下向き)は、特定の範囲のサポートを持つアイテムセット/ルールのみを効率的に生成することはできません。すべての頻出アイテムセットを作成してから、R実装でフィルタリングする必要があります(arules)。あなたの問題に対してよりメモリ効率の良いFP成長や同様のアルゴリズムの実装があるかもしれません。

この問題にアプローチするもう1つの方法は、データをより詳細に見ることです。たぶんあなたは、多くの取引に現れるいくつかのアイテムを持っているかもしれません。これらのアイテムはあなたにとって興味深いものではないかもしれませんし、マイニングルールの前に削除することもできます。

+0

大きなアドバイス!私は最も一般的なアイテムのいくつかを削除し、それは私がたくさんのものになりたいと思っています。ありがとう。 – Coopa

関連する問題