私は、猫対犬の分類、猫の画像があまりに多く、犬の画像が少なすぎる場合のような画像分類問題の不均衡を知っています。しかし、セグメンテーションの問題で不均衡を解決する方法がわかりません。イメージセグメンテーションの不均衡とは何ですか?
たとえば、私の仕事は衛星画像から雲の覆いを隠すことです。そのため、問題を2つのクラス分けに変換します.1つはクラウド、もう1つは背景です。このデータセットには、256×256のサイズの5800 4バンド16ビット画像があります。アーキテクチャはSegnetであり、損失関数はバイナリクロスエントロピーである。
仮定2例があります:すべてのサンプルの
- 半分は雲によって完全に覆われているが、半分は任意の雲なしです。
- すべての画像で、半分は雲で覆われ、半分は雲で覆われていません。
ケース2はバランスが取れていますが、ケース1はどうですか?
現実と私の仕事では、雲のカバーは常にバックグラウンドに対して相対的に小さいので、ソースの衛星画像では2つのケースは不可能ですが、大きなサイズのために画像サンプルがソース画像から切り取られると、出現する。
ので、サンプルは常に画像の3種類含まれています
- 完全に雲(5800個のサンプルでは254)でカバーを。
- 雲なし(5800サンプル中1241)。
- 一部の地域は雲で覆われていますが、一部の地域ではありません。 (他のサンプルでは多分少し5800で4305が、私はいくつかのサンプルでは非常に高いかもしれない、雲の割合を知らない、)
は私の質問:
が不均衡のサンプルであり、私が何をすべき?
ありがとうございます。
あなたの修正と対応に感謝します。私はcaffeの "InfogainLoss"レイヤーを試してみます。 – spider
kerasのようなcaffeのようなクラス単位の精度を出力する方法を知っている人はいますか? – spider