私は、ヒストグラムの方向勾配(HOG)の機能に取り組んでおり、私はDalalの博士論文で説明されているヒストグラムビンの三線式補間を実装しようとしています。そして、彼は補間プロセスを以下のように説明する。HOGヒストグラムビンの三線式補間
編集:大まかに言えば、ブロックに分割された64x128ピクセルウィンドウからHOG特徴が抽出される。各ブロックは2×2セルから構成され、セルは8×8ピクセルから構成されます。抽出は、画像の一次微分を計算することから始まり、各ピクセルの向きおよび大きさが計算される。画素が画素の向きに基づいて大きさの値を有するヒストグラムに寄与する各8×8画素セルについてのブロック内の方位ヒストグラムが計算され、大きさが方位と位置の両方で隣接するビンセンタ間で補間される。ヒストグラムには、9つのビンが0〜180度で20度のストライドを表します。アルゴリズムの全体的な描写は、ここで見ることができる:http://4.bp.blogspot.com/_7NBDeKCsVHg/TKBbldI8GmI/AAAAAAAAAG0/G-OXUz1ouPQ/s1600/a1.bmp
我々はRST一次元空間で線形補間 を説明し、その後 3-Dに拡張FI。 hをビン間距離(帯域幅)を有するヒストグラム とする。b。 h(x)は、xを中心とするビンのヒストグラム の値を示します。 ヒストグラムに点xの重みwを補間したいとします。 x1とx2を、 点の最も近い隣のビンとし、x1≦x < x2となるようにします。 3-D点でX = [X、Y、Z、W
レットを次補間する量である として線形補間は、2人の最も近い隣人に 重みwを分配します。 x1とx2をxを含むヒストグラムキューブの の2つのコーナーベクトルとしましょう。ここで、各コンポーネントに があります。x1≤x < x2です。 とし、x軸、y軸、z軸に沿ったヒストグラム の帯域幅は、 b = [bx、by、bz]で与えられると仮定します。
:トリリニア補間 は、以下のように8つの周囲のビン中心に 重みwを分配します。
セルのヒストグラムを計算し、すべてのピクセルがヒストグラムにその大きさの値を与えます。私が定式化から理解することは、xとyは検出ウィンドウ内のセルの位置を表し、zはビン数です。 64×128の検出ウィンドウでは、8×16セルと9つの方向ビンがあり、ヒストグラムはh(8,16,9)と表されます。上記のステートメントが正しい場合、(x1、y1)と(x2、y2)はそれぞれ前のセルと文字セルを表しますか? z1とz2は、以前と文字の向きのビンを意味しますか?帯域幅b = [bx、by、bz]はどうですか?
誰かがこれらの問題を明確にすることができれば、本当にありがたいです。
ありがとうございました。
これは元々の参考資料です。http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf – whoplisp
はい、これは元の参考資料です。ありがとうございました! –
OPの画像については、論文ページ117を参照してください。ヒストグラムの構築は95ページに示されています。 – whoplisp