2017-01-30 5 views
-1

私は自分のデータから頻繁にパターンを採掘したいと思います。私のデータセットは非常に大きいです。まず、トランザクションデータベース形式に変換する必要があります。事は私のデータベース(500000レコードの)には402のユニークな繰り返しアイテムがあるということです。どこでも最大8文字(A、B、C、D、E、F、G、H)のデータセットでfp-growthの例が表示されていますが、402個のユニークな項目を表現する必要があります。このアルゴリズムにアルファベットの組み合わせを使用できますか?それとも他の方法がありますか? ありがとうございますFP成長許容入力データ型とは何ですか?

答えて

1

あなたの実装によって異なります。

しかし、「ミルク」や1文字のアイテムだけでなく、

関連する問題