2016-08-03 15 views
1

私はオブジェクト検出アルゴリズムを理解し、適切なプログラムを作成するために、Viola-Jonesの論文を勉強していました。フィーチャのトピックの最後の段落では、24x24のディテクタの基本解像度について著者が述べています。矩形フィーチャの完全なセットは180,000以上と非常に大きくなっています。 Haar基底とは異なり、矩形フィーチャのセットはオーバーコンプリートです。これは、すべての単一の矩形フィーチャが24×24であることを意味しますか?つまり、与えられたイメージを24×24ブロックに分割するということですか? 180000は、24×24ブロックごとにいくつかのタイプのHaarのような特徴を見つけた結果ですか?また、矩形フィーチャのセットが完全すぎるという最後の部分も理解できませんでした。私たちが矩形の特徴について話しているとき、何が完璧ではないのですか?ありがとう。オブジェクトを検出するためのHaarのような機能

答えて

1

すべての24X24矩形フィーチャは、同じ段落で前述したように、「2つの矩形フィーチャの値は、2つの矩形領域内のピクセルの合計の差です」と「3つの矩形フィーチャ中央矩形内の合計から2つの外側矩形内の合計を差し引いて計算し、最後に4矩形フィーチャは対角線対の差を計算します。

あなたが見つけることができる数180,00についての説明: Viola-Jones' face detection claims 180k features

過完備のセットを使用すると、他の機能の線形結合されているいくつかの機能を有することを意味します。 24×24の矩形特徴の場合、すべての四角形を値の1の四角形で取り、残りのすべてをゼロにして、この空間の線形基底を構築することができます。この構成のオプションの数を計算すると、24 * 24 = 576となり、これは180,000よりはるかに少ないものです。これは、180,000のセットから、セットから他の矩形の組み合わせとして得ることができるいくつかの矩形を持つことを意味します。

関連する問題