2017-04-09 12 views
1

min maxスケーリングを適用してフィーチャを正規化している間に、トレーニング、検証、およびテストデータに分割する前に、データセット全体でmin maxスケーリングを適用しますか?トレーニングデータとテストデータに対してmin maxスケーリングを個別に適用しますか?

または、最初に分割してから、その特定のセットの最小値と最大値を使用して各セットにmin maxを適用しますか?

最後に、新しい入力を予測するとき、その入力のフィーチャをトレーニングデータの最小値、最大値を使用して正規化してから、ネットワークに入力する必要がありますか?

答えて

3

それを分割し、スケールします。このように想像してみましょう。実世界のデータがどのように見えるかわからないので、トレーニングデータをそのデータに合わせることができませんでした。あなたのテストデータは実際のデータのサロゲートなので、同じ方法で処理する必要があります。

繰り返す:訓練データを分割してから、訓練データのスケーリングをテストデータに使用します。

+0

ありがとうございます!理にかなっている。 – shekit

+1

最後の行と一致するように、最初の行を改訂する必要があります。 「分割後に拡大縮小する」ことは紛らわしいかもしれません。 –

+0

完了。ありがとう、@ VivekKumar。 –

関連する問題