2

ソース記述における方法理解load_image()pycaffe

Load an image converting from grayscale or alpha as needed. 

Parameters 
---------- 
filename : string 
color : boolean 
    flag for color format. True (default) loads as RGB while False 
    loads as intensity (if image is already grayscale). 

Returns 
------- 
image : an image with type np.float32 in range [0, 1] 
    of size (H x W x 3) in RGB or 
    of size (H x W x 1) in grayscale. 

そして、これは使用方法の一例であること

input_image = 255 * caffe.io.load_image(IMAGE_FILE) 

私の質問であるIMAGE_FILEは、各チャネル0のRGB色がある場合-255の値と戻り値caffe.io.load_image(IMAGE_FILE)は[0,1]の範囲にあり、255を掛けると、各チャネルの範囲は依然として0-255です。

この手順を実行するにはどうすればよいですか?

答えて

1

範囲タイプを浮遊画像を読み取るための理由[0..1]は、次のとおり

  1. 一部のモデルでは、バック[0 255]に入力をスケーリングではなく、入力を処理しません範囲[0..1]である。
  2. 画像データタイプをuintから浮動小数点に変換するときに、ピクセル値を[0..1]にスケーリングすることは非常に一般的です(Matlabのim2doubleim2singleを参照)。
  3. 画像フォーマットの中には範囲[0..65536](2バイト/ピクセル)のデータがありますが、そのような場合は範囲​​を固定しておくと便利です。
+1

ありがとうございます、今、私にはもっと意味があります。 –