私はかなり異なる画像セット(B & W 16ビット)を使って転送学習タスクのためにKernetのresnetの実装を使用しようとしています。 Kerasは入力として何を期待していますか? 3つのチャンネルと-127-128の範囲の画像(これは、私がゼロの中心に置かれた8ビット画像と仮定したものです)? 0-255?この範囲外のものを渡すとどうなりますか?KerasのResnetは入力として何を期待していますか?
ありがとうございました。
私はかなり異なる画像セット(B & W 16ビット)を使って転送学習タスクのためにKernetのresnetの実装を使用しようとしています。 Kerasは入力として何を期待していますか? 3つのチャンネルと-127-128の範囲の画像(これは、私がゼロの中心に置かれた8ビット画像と仮定したものです)? 0-255?この範囲外のものを渡すとどうなりますか?KerasのResnetは入力として何を期待していますか?
ありがとうございました。
Kerasのドキュメントで提供されているpaperによれば、224 x 224 RGB [0 - 225]
イメージを提供する必要があります。実際のディメンションの順序は、Kerasインストールで使用するバックエンドによって異なります。
データ準備はAlexNetのように行ったので、平均活性化を各カラーチャンネルから差し引いた。 RGBの平均ベクトルは103.939, 116.779, 123.68
です。
色の値が-255, 255
の範囲になると、ネットワークのデータが不明であるため、トレーニングに害を及ぼす可能性があります。しかし、まだネットワークはこの変化に適応することができますが、通常はより多くの時間を費やし、より混乱したトレーニングを行います。
単色画像の場合、一般的に使用されている技術は、同じチャネルを3回繰り返して、ネットワークアーキテクチャに適した次元にすることです。
ありがとう、Marcin –