2012-03-07 6 views
1

私はRapidMinerを使用する方法を学んでいます。私の上司は、一連のデータについてマーケットバスケット分析を実行したいと考えています。しかし、私が与えられたテンプレートを使用すると、私は次のエラーを受け取ります:RapidMinerエラー:通常の属性は、型が二項型である必要があります。市場バスケット分析

普通の属性は型が二項でなければなりません。
これはFP成長演算子で与えられます。

私はcustomerID(数字のみ)、productName(文字)およびProduct Quantity(数値)の列を持っています。

私はRMの初心者なので、何が間違っているのか分かりません。

すべての入力をいただければ幸いです。
ありがとうございます。

答えて

2

FP-Growthには、すべての通常の属性がこの場合はブール値を意味するbinominalであるExampleSetが必要です。バイノーナル属性には、定義済みの正/真と負/偽の値がある場合もあります。そうでない場合は、FP-成長演算子のパラメータとして正の値を指定できます。さらに、すべての例は取引(または顧客のバスケット)を表し、すべての属性は商品ライン全体のアイテムを表し、この属性の値はアイテムがバスケット内にあるかどうかを定義します。

関連ルールを見つけるには、最初に頻出アイテムセットを見つける必要があります。これはFP成長オペレータの仕事です。あなたの仕事は、ExampleSetを "トランザクションデータベース"に変換することです。つまり、すべての属性は2項です。

残念ながら、RapidMinerのテンプレートはちょっとバグがあります。このプロセスを修正するには、FP-Growth演算子の前に2つの演算子を追加する必要があります。まず、すべての欠損値を値0(Operator 'Replace Missing Values'とパラメータ 'default'をゼロに置き換える)に置き換える必要があります。交換の後には、「二項演算子」演算子が必要です。デフォルトのパラメータ値は、すべての属性を2項のものに変換するのに十分です。プロセスは今すぐ実行する必要があります!頻繁な品目を見つけるには、十分な小額のサポートが必要であることに注意してください。

0

各製品の製品の場合、お客様のデータを1行(実際にはトランザクション)と1つの量の列(mabyeバイナリ)の形式に変換(折りたたむ)する必要があります。スパースベクトルを使用して、0のすべての保存を保存します。

関連する問題