2017-01-06 4 views
0

カフェ入力層では、使用されるすべての画像の平均値を保持する平均画像を定義することができます。画像ネットの例から:「モデルは、各画像から画像平均を引く必要があるので、平均を計算しなければならない」。平均バイナリファイルでcaffeは何をしますか?

私の質問です:この減算の実装は何ですか?それは単純です:それは最初の二つのいずれかの場合

used_image = original_image - mean_image 

または

used_image = mean_image - original_iamge 

または

used_image = |original_image - mean_image|^2 

、その後、どのように負のピクセルhandeldありますか?ピクチャは通常uint8に格納されているので、単に最初から始まることを意味します。例えば

200 - = 56 255

私はこれを知っておく必要がありますなぜ?私はテストを行い、第2の例または第3の例がうまくいくことを知っています。

答えて

1

これは最初のものですが、簡単な正規化ステップです。代わりに秒を使用することは重要ではありません。重みは逆転します。

"負のピクセル"自体はありません。これは、単にマトリックス演算の整数入力です。 は、これをある種の視覚的な変更として解釈しても構いませんが、算術は気にしません。

+0

ありがとう、私はソースコードを掘り下げていて、それを見つけました(data_transformer.cppの115行目)。 – Kev1n91

+0

良いsleuthing - 今あなたは、道に沿ってピックアップされた他の学習と共に、直接の知識を持っています。 – Prune

+0

私はちょうどこれについて議論しました:これは入力層で行われるので、このコードはGPUに既に含まれており、すべてがフロートに変換されるので、暗いピクセルが負の数になることを意味します – Kev1n91

関連する問題