2017-08-14 8 views
2

H2Oモデルで標準化された機能をRで使用すると、新しいデータをスコアリングするときにどのように機能するのか不思議です。新しいデータにH2Oの標準化を使用する場合

私はそれがトレーニングセットに標準化したときにトレーニングデータの平均値と標準偏差に基づいて1に0と標準偏差を平均値を設定していることを知っているが、それは新しいデータで何をするのでしょうか?

トレーニングデータの平均値と標準偏差に基づいて標準化するのか、それともスコアリングする新しいデータに基づいて標準化していますか?

答えて

0

スコア関数は、トレーニングデータをテストデータセットに標準化するために使用されたのと同じマッピングを適用します。これはH2Oによって自動的に処理されます。

+0

おかげでエリンは、それは私の推測では、それ以外の係数はとして解釈ではありませんでした。私はそれぞれの機能を見守って、あまり変わらないようにしなければならないと思う。私のためにこれらのマッピングを抽出する関数があるかどうかも知っていますか?すなわち、各フィーチャを標準化するために使用される平均および標準偏差、または生データ... mean(x)およびsd(x)上でそれを行う関数を書くだけです。基本的には、モデルをデータベース内の自分のデータに近づけて、モデルの関数をSQLを使って手動で書きたいと思っています。 –

+0

いいえ、これらのメソッドは、H2OクライアントAPI(私が知っている)を介して公開されていません。あなたはこれをオフにして、手で操作を行う(その他のALGは、機能をワープしていないGLM & DL;に 'standardize'引数を参照)が、あなたは、モデリングのためのH2Oを使用するつもりなら、それはH2Oハンドルを聞かせするのが最も簡単ですすることができますこれは自動的に行われます。 –

+0

私はh2oが標準化された係数と非標準化された係数の両方を生成することを発見しました。標準化されていないデータに対して非標準化されたデータを使用することができます。 –

関連する問題