2016-12-23 16 views
0

SklearnおよびMinMaxScalerメソッド(0.1、1)でデータを正規化しようとしましたが、結果は非常に不調です。 MinMaxの正規化がなければ、問題の精度は78%でしたが、min maxの正規化では71%になりました。 問題が何かを知っていますか?mlpの正規化結果が悪い

マイデータの形状は次のとおりです。[n_samples] [1D_vector_of_values】ここで

は、私は正規のためsklearnを使用する方法である:助けを

scaler = MinMaxScaler(feature_range=(0.1,10)) 
X = np.array(X) 
X_test = np.array(X_test) 
X = scaler.fit_transform(X) 
X_test = scaler.fit_transform(X_test) 

ありがとう!

答えて

1

正規化では、この識別方法を適用してデータを失っているため、正常な結果が得られません。それはすべてデータの性質に依存します。

範囲正規化の代わりに標準化を実装しようとしていますが、テストと検証に同じ標準化バッチを使用するように注意してください。私たちはあなたのデータに関する情報を私に与えてくれませんでしたが、私はまだ正規化/標準化の後に機能選択を実装するよう依頼していました。

+0

こんにちは、お返事ありがとうございます! 私はkaggleのデータセットをクレジットスコアに使用しています。 彼らは形[年齢、性別、年収、月額請求書、...]を持っています。合計10フィールド。 正規化の適用時期を判断する方法はありますか? 標準化に対する標準化の関心は何ですか? 機能選択のために、私は神経網を使用しているので、nnはそれ自体ではいけませんか? ありがとう! –

+0

ここにリンクが違いを説明しています。 http://www.benetzkorn.com/2011/11/data-normalization-and-standardization/あなたが言ったように、おそらくすべての機能を保持することが重要です。もちろんNNはあなたのためにこの仕事をすることはできません。それは最高のモデルを構築するのに役立つフィーチャービルドを行うあなたの仕事です。 – Feras

関連する問題