2017-10-12 31 views
0

私は、キーポイントを中心に16x16ピクセルの「中間」ピクセルを取ることを知っています。そのウィンドウを16個の4×4ウィンドウに分割しました。各4x4ウィンドウから、8個のビンのヒストグラムを生成します。各ビンは0〜44度、45〜89度などに対応しています。4x4からの勾配方向はこれらのビンに入れられます。これはすべての4x4ブロックに対して行われます。最後に、得られた128の値を正規化します。 彼らは彼らの価値をどこに得ますか128の記述子?

私は128番号がどこから価値を得ているのか誤解していますか?これは、向きの値の対応する大き​​さを参照していたのですか?

誰かが数値の例を説明してくれたら、私は感謝しています。 SIFTで

+0

あなたはあなたが何を求めているのか少し分かりますか? –

答えて

0

(スケール不変特徴変換)、128次元の特徴ベクトルがサンプルあたり8つの方向におけるウィンドウ当たり4x4のサンプルで構成されている - 4x4x8 = 128

図示ガイドA Short introduction to descriptors参照

enter image description here

:次に、4×4のグリッドの正方形の各々に埋め込まれた8方向の測定(カーディナル及びインターカーディナル)(中央の画像)と方向のヒストグラム(右画像)を示し、特に、この画像、

私たちの質問ディスクリプタ内の情報がであるかどうかも不明であると信じています。これは、HOG(Histograms of Oriented Gradients)と呼ばれています。さらに読書のために、ウィキペディアはHOG gradient computationの概観を有する。

セル内の各ピクセルは、勾配計算で求めた値に基づいて方位ベースヒストグラムチャネルに対する加重投票をキャスト。

すべては、ピクセルごとの「票」に基づいています。