私は後者のための擬似コードを使用して、様々な異なるの質問に答えてみます。
1-著者の最終的な目的は、という追跡(私は推測していると思いますが、私はこの論文を読んでいない)のウィンドウの記述子を取得するように思われます。したがって、シルエットS
およびFx
およびFy
チャネルを計算した後、著者はMxMx3
のウィンドウを有し、3チャネルは[S, Fx, Fy]
を付加している。 (1)は非常に高次元であり(MxMx3
、おそらく変数M
)、(2)スケールまたは向きが不変ではない、(3)ロバストな記述子ではないため、これはウィンドウを表現するのには適していません。筆者はMxMx3
チャンネルを216次元の記述子(MxMx3 -> 216
、M
に関係なく)に変換するヒストグラム法(HoGのものに似ていますが、同じではありません)を使用しています。
2-上記の回答があります。 HoGではありませんが、HoG、SIFTなどの特徴抽出方法に似ています。
3-私が間違っていることを理解していない場合は、境界ボックスを2x2グリッド(4つの四角形/サブウィンドウ)で分割します。各サブウィンドウについて、20度の18スライスで分割します(これはまっすぐではありませんが、サブウィンドウの中心に対するピクセルの位置を知っているので、角度を計算することができます)。それは落下
を次に、(0 <= i,j < 2
付き)サブウィンドウ(i,j)
に属する画素p
及びパイスライスk
を有するヒストグラムに(チャネルのそれぞれに)その値を追加します。
hist(i, j, k, c) += data(p, c)
ここでc
はチャンネル(3チャンネル[S, Fy, Fx]
)で、data(p, c)
は、ピクセルの3チャンネルのデータですおよびチャネルc
。
あなたは2x2x18x3 = 216
という記述子で終わるでしょう。uが提供エキスは、その記述を正規化については何も言及していないが、私はそれが何を言っていないならば、それだけだろうと思います。
hist(i, j, k, c) /= sum(abs(flatten(hist)))
それとも別にサブ窓やチャネルのそれぞれを正規化します(豚で行われているような):
hist(i, j, k, c) /= sum(abs(hist(i, j, :, c)) # summing over the 3rd axis `k`
あなたは(リンクを入れおろか)紙に名前を付けることなく、紙についての質問をされた後、[ウィキペディア]で説明されたアルゴリズムについて尋ねる(HTTPS:/ /en.wikipedia.org/wiki/Lucas%E2%80%93Kanade_method)? –
私はアルゴリズムについて尋ねていません、私は別の論文で使用されているヒストグラムの利点について尋ねています! – Mammo
意味のある回答を得るには、質問を言い換えてみてください。何を試しましたか?あなたの考えは?あなたはどの論文を参照していますか? Stackoverflowには、[質問する方法](http://stackoverflow.com/help/how-to-ask)の特別なセクションがあります。 –