2016-07-26 19 views
2

私はその区間(-1,1)内に一連の特徴を持っています。私は単射関数またはデータを特定の範囲に平均値が0に近く、分散が1に近い値に正規化する方法を探しています。データ/フィーチャの正規化

機能が全身的であることは非常に重要ですtanh活性化機能を有するニュートラルネットワークの入力として使用される。私のプロセスは、メモリ内でデータを変換し、ネットにフィードし、ネットワーク結果を初期スケールに戻すことです。

答えて

2

この正規化タスクは、ニューラルネットワークのアプリケーションではかなり一般的です。最も一般的なアプローチは、データの平均と標準偏差を単純に計算し、その値をトレーニングプログラムに保存することです。だからあなたのデータのためのパイプラインは次のようになります。

  1. 計算meanと入力データのsdやメモリに格納します。
  2. 正規化変換を適用:normed_data = (data - mean)/sd
  3. ネットワークのトレーニング/評価/使用。
  4. データの非正規化は、original_data = (normed_data * sd) + meanです。

私はデータの正規化についてより長い投稿を書いています。あなたはそれを読むことができるhere

+0

ありがとうございました。この場合でも変換関数Phiを適用することができました。前に、私はそれが変換に使用されていることを知っていました。通常の分散データを標準化して正規分布表を使用しました。 –

+0

あなたの記事では、平均と標準を計算する必要があると言いました。 Ysの偏差、出力も同様です。理由を説明してください。 例を次のように考えてみましょう: サンプルは、特定の間隔(x0、x1)の乱数の集合Sです。入力xiおよび目標yjは、常にSのサブセットである。入力は、nからm-1までのシーケンスによって選択され、ターゲットはmである。平均と標準の別々の計算を行いますか?偏差もこの追跡に適用されますか? –