2017-12-26 11 views
1

私はh2o.aiのautoml関数をいくつかの問題を抱えて作業していますが、かなりの成功を収めましたが、ベクトルレスポンスでh2o.aiのautomlを設定することは可能ですか

私は6つの応答にマップする500余りの予測因子を使用し、問題(すべてのフロート)持って

必要なデータパラメータ

yは(再びすべてのフロートを。):この引数は、レスポンス列の名前(またはインデックス)。

3.16 docs

automlライブラリは、単一の応答を処理しているようです。何か不足していますか?おそらく用語でさえ?

私がそうでない場合は、レスポンスごとに6つの別々のリーダーボードを作成し、その結果を使用して手動ネットワーク検索を開始することを計画しています。

理論的には、私は実際に6つのautomlモデルを個別に実行してベクトル応答を得ることができたと思いますが、それは奇妙なアプローチのように感じます。

いずれの洞察も認められます。 乾杯。

答えて

1

AutoMLだけでなく、一般的にH2Oは、1つのことを予測できるようにします。

これらの6つの出力が表すものと互いの関係についての情報がないと、私は3つのアプローチを考えることができます。

アプローチ1: 6種類のモデルをお勧めします。

アプローチ2:オートエンコーダをトレーニングして、6次元から1次元に圧縮します。次に、その単一の値を予測するためにモデルを訓練します。次にそれを広げてください。 (例:モデルが1.123を予測し、[1,2,3,4,5,6]が1.122、[3.14,0,0,3.14,0]と表されている場合など、トレーニングデータのルックアップテーブルによって、0]は1.125で表され、[1,2,3,4,5,6]、またはこれらの2つの最も近いマッチの加重平均を選択できます)(PCAなどの他の次元削減アプローチは同じですあなたの6フロートの可能な組み合わせが(比較的小さい)有限集合であれば、N個のカテゴリに明示的なルックアップテーブルを持たせることができます。

それぞれが連続変数であると仮定しているため、アプローチ3は2に近づくはずです。したがって、6つの出力間に相関関係がほとんどない場合、アプローチ1 。

+0

6つの出力は、モデル化したい特定の次元削減マッピングを表します。 このように、それらは非常に独立している必要があります。したがって、「アプローチ1」は最良の選択肢のようです。 ご協力いただきありがとうございます。 –

+0

@PaulHannahあなたが後になっている次元が500から6次元に縮小されている場合は、単にそれを行うように設計された自動エンコーダーを使ってみましたか? h2o.automlは仕事のための間違ったツールかもしれませんか? –

+0

提案していただきありがとうございます。はい、私はそれを与えましたが、いくつかの問題に遭遇しました。まず、そこに到達するために必要な計算量です。もう1つは、特定の機能を強調する特定のマッピングを探していることです。 –

関連する問題