2017-09-22 4 views
0

私はWEKAにかなり新しく、111 cases109 attributesというデータセットがあります。私はCfsSubsetEvalとのWEKAの機能選択タブをfeature selectionに使用しています。私はleave-one-out cross-validationを使用しています。CfsSubsetEvaluatorは、機能の選択中に相互検証の各ステップで機能を選択する際に、いくつの基準および/またはどの基準を使用しますか?

だから、どのように多くの機能WEKAが選ぶんや機能の数のための停止基準は、この方法は、クロスバリデーション

おかげで、

Gopi

答えて

0

CfsSubsetEvalアルゴリズムの各ステップで選択するものです一緒にうまく機能するフィーチャのサブセットを検索しています(フィーチャとターゲットラベルとの相関が低い)。サブセットのスコアはメリットと呼ばれます(出力で見ることができます)。

BestFirst検索では、選択する機能の数を特定できません。ただし、GreedyStepWiseなどの他の方法を使用するか、/GainRatioアルゴリズムをRankerと使用して、機能セットのサイズを定義することができます。

セットのサイズに影響を与えるもう1つのオプションは、検索の方向(前方、後方...)です。

幸運

+0

あなたの説明をありがとう。私は疑問がもう1つあります: 'BestFirst'検索メソッド' parameters'のための 'WEKA'では、** searchTermination - 検索を終了する前にできるように改善されていないノードの数を指定します** _。これは、相互検証の各ステップにおける機能の数の停止基準に似ていますか?あなたは説明してください – Gopi

+0

私が言ったように、アルゴリズムは、各サブセットの "メリット"スコアを計算します。ベストファーストはほとんど貪欲です。前のパラメータがスコアを改善しなかった場合、パラメータはより良いサブセットを見つける試行回数を決定します。サブセットに到達すると、それを改善することはできません。見つかった最良のセットを停止して返します。 – AndreyF

関連する問題