2016-04-07 7 views
0

私はリレーショナルデータセットをダウンロードしました。Rapidminerを使用して頻繁なパターンと関連ルールを抽出したいと思います。私の質問は、どのような種類のデータを関連ルールや頻繁なパターン、リレーショナルまたはトランザクション、または...を抽出するために採掘することができるかです。 私は、リレーショナルデータセットから頻繁なパターンを生成しようとしますが、属性は二項式でなければならないRapidminerエラー???リレーショナルデータの関連ルールを抽出する方法

答えて

0

関連付けルールマイニングを行うための適切なデータセットは、リレーショナルデータセットです。場合によっては、データセットが望ましいフォーマットになっていることもあります。その場合は、そうでない場合もあります。すべての属性をバイナリタイプに変更して、すべてのセルを偽または真にする必要があります。アトリビュートタイプが数値であった場合、離散化を実行する必要があります。これらのプロセスはすべてRapidminerで事前定義されています。

0

RapidMinerのデフォルトリポジトリSamples/processes/01_Learner/24_FPGrowthを参照して、FPGrowthおよび関連付けルール生成を実行する実例を見つけてください。この例では、生データをこれらの操作に適した形式に変換する方法を示しています。オペレータNominal to Binominalが必要なものです。

+0

ありがとう、属性についてはどうですか?例えば、私のリレーショナルデータセットは数値属性を持っていますが、FPGrowthを実行したいときにはrapidminerにあります。あなたの属性は二項式でなければなりません。他の種類の属性やFPGrowthをトランザクションデータセットだけで無視する必要がありますか? – user3102296

+0

FpGrowthを実行するための属性ageには数値がありますが、それをnominalに変換してbinominalにするか、無視しますか? – user3102296

+0

数値属性を名義に変換するには、Discretize演算子の1つを使用します。これらは数値範囲を指定されたビンに分割し、各ビンをビンの1つに割り当てます。丁度名義に変換すると、遭遇する数字ごとに異なる値が得られます。これはおそらくあなたが望むものではありません。 – awchisholm

関連する問題