2017-06-12 54 views
1

私は、対象クラスがデータセットのわずか7%であり、母集団全体が約1200の観測である分類問題があります。畳み込みニューラルネットワークの不均衡クラス

KerasのImageDataGeneratorは、モデルをトレーニングする前に観測数を増やすためにデータを拡張するのに役立ちますが、ノイズを追加したり、少数派クラスのみを変換したりするように、 ?

答えて

1

あなたは加重値に辞書マッピングクラスを取るclass_weight引数フィットで()関数でバランスを取るために試みることができるのいずれか。あなたは適切なクラスの重みを計算するためにsklearnを使うことさえできます。 PSCはここに答えるください:https://datascience.stackexchange.com/questions/13490/how-to-set-class-weights-for-imbalanced-classes-in-keras

それとも、(flow_from_directoryでKeras ImageDateGeneratorを使用することができます)、それによって過少代表クラスのより多くの例を生成save_to_dir引数を使用してディレクトリに実行を増強した画像を保存:https://keras.io/preprocessing/image/#imagedatagenerator

そのダミーについてあなたはより多くのサンプルを必要とするクラスのサンプルのみを提供します。

次に、実際のトレーニングにバランスの取れたトレーニングデータと検証データを使用します。

0

トランスフォーメーション、ズーム/ストレッチ、ノイズ、ぼかしなどの画像を強化するための機械学習ツールキットがあります。

オーグメンタはここで見つけることができます画像: https://github.com/codebox/image_augmentor

関連する問題