2017-11-02 7 views
0

大容量のデータセット2304 数値の属性とクラス属性)があります。誤解を招くような冗長属性。これは、それらを公称にするために離散化を実行してから、データセットでナイーブベイズを実行するためです。多数の属性のセットから属性の自動削除を実行する方法

ただし、Wekaの[属性の選択]タブでは、順位順にのみ一覧表示されます。私は、前処理タブにフィルターを削除していることを知っていますが、範囲または属性の数だけを取ります。

このような大きなデータセットのため、これらを削除する自動化された方法がありましたか?

答えて

0

[前処理]タブ AttributeSelectionフィルタ(監視属性フィルタ)を選択します。 評価者を設定し、必要に応じて検索します。 適用してください。

これは、フィルタを通過するものだけを保持します(もちろん、クラス属性を保持します)。 結果が気に入ったら、これを新しいarffファイルとして保存してください。

+0

私は 'InfoGain'フィルタを選択しましたが、それでも2304個の属性とクラスを保持していますが、クラスを削除しません。 – rshah

関連する問題