2017-01-24 6 views
1

私はかなり異なる画像セット(B & W 16ビット)を使って転送学習タスクのためにKernetのresnetの実装を使用しようとしています。 Kerasは入力として何を期待していますか? 3つのチャンネルと-127-128の範囲の画像(これは、私がゼロの中心に置かれた8ビット画像と仮定したものです)? 0-255?この範囲外のものを渡すとどうなりますか?KerasのResnetは入力として何を期待していますか?

ありがとうございました。

答えて

2

Kerasのドキュメントで提供されているpaperによれば、224 x 224 RGB [0 - 225]イメージを提供する必要があります。実際のディメンションの順序は、Kerasインストールで使用するバックエンドによって異なります。

データ準備はAlexNetのように行ったので、平均活性化を各カラーチャンネルから差し引いた。 RGBの平均ベクトルは103.939, 116.779, 123.68です。

色の値が-255, 255の範囲になると、ネットワークのデータが不明であるため、トレーニングに害を及ぼす可能性があります。しかし、まだネットワークはこの変化に適応することができますが、通常はより多くの時間を費やし、より混乱したトレーニングを行います。

単色画像の場合、一般的に使用されている技術は、同じチャネルを3回繰り返して、ネットワークアーキテクチャに適した次元にすることです。

+0

ありがとう、Marcin –

関連する問題