2009-11-20 7 views
11

私は、動くビデオでオブジェクトを検出する最も速く効率的な方法を探しています。このビデオについての注意点:非常に粒状で低解像度で、背景と前景の両方が同時に動いています。低解像度動画のオブジェクト検出に最適な方法は何ですか?

注:動画の中の道路上の移動するトラックを検出しようとしています。

方法私が試した:

はハールカスケードトレーニング - 私は、目的のオブジェクトのコッピング複数の画像を取ることによって、オブジェクトを識別するための識別器を訓練しようとしました。これは、多くの誤検出または全く検出しない(所望のオブジェクトが決して検出されなかった)ことを証明した。私は約100枚のポジ画像と4000枚のネガを使用しました。

SIFTとSURFキーポイント - 機能に基づいたこれらの方法のいずれかを使用しようとすると、私が検出したいオブジェクトが解像度が低すぎることを発見しました。検出。 (目的のオブジェクトは検出されませんでした)

テンプレートマッチング - これはおそらく私が試した最良の方法です。それらの中で最もハッキリですが、最も正確です。私はビデオからトリミングされたテンプレートを使って特定の1つのビデオのオブジェクトを検出できます。ただし、既知のものがすべてフレームごとに最もよく一致するため、確度の保証はありません。フレームに一致するパーセントテンプレートについての分析は行われません。基本的には、オブジェクトが常にビデオ内にある場合にのみ機能し、そうでない場合は、誤検出が発生します。

これは私が試した3つの大きな方法です。すべて失敗しました。何が一番うまくいくかは、テンプレートマッチングのようなものですが、スケールと回転の不変性(SIFT/SURFを試しています)がありますが、テンプレートマッチング関数を変更する方法はわかりません。

このタスクを最もうまく実行する方法についてご意見がありますか?

+2

どのトラックが配向されている。このように働いていたやや古いプロジェクトはここだ

?その形状や向きは変わるのか?カメラは位置を変えますか?これは単発的なビデオなのか、それともさまざまな状況で動作する必要があるシステムなのでしょうか? – endolith

+0

私はエンドリスに同意しますが、それはあなたがより詳細で問題を定義することが重要です。メソッドの選択は頑健性に影響します。 – Ivan

+0

トラックを横から見て、水平に動いています。 車両の形状はそれほど変わらないので、テンプレートマッチングはうまくいきますが、私の方法は頑丈なものにしたいと思っています。 基本的に、カメラは、いくつかの異なる車両に続いて左右にパンし、いくつかの他の車両はバックグラウンドで過去に走行します。 本質的に、これは1つ以上の状況で動作するようにしたい(ただし主に似たような品質のビデオを扱う)。私が達成したいと思っているのは、動くビデオの中の動く物体の検出器です。 – monky822

答えて

0

どのように低解像度で話していますか?また、オブジェクトについて詳しく説明できますか?それは特定の色ですか?それはパターンを持っていますか?答えはあなたが使用すべきものに影響します。

また、私はあなたのテンプレートマッチングステートメントを間違って読んでいるかもしれませんが、それは(あなたがオブジェクトを抽出したのと同じビデオをテストして??で)テストしすぎているようです。

+0

解像度は720x480ですが、ビデオの品質は非常に悪いです。ビデオはこの解像度で非常にピクセル化されています。 テンプレートマッチングに関して、私は何も訓練していません。私はちょうどビデオからクロップされたオブジェクトを使用しているだけで、各フレームから検索しています。 – monky822

+0

あなたはそれを訓練しています。ちょうど1セットのデータです。オブジェクトの照明や向きがほとんど変化しない場合、テンプレートはうまく一致します。その瞬間、精度は本当に落ちます。 ただし、できるすべてのキューを使用してください。もしあれば色。 – UsAaR33

0

ハールカスケードは、あなたの重要なトレーニングデータを必要とし、向きの調整には不十分です。

camshift in opencv (5,7MB PDF)に類似したアルゴリズムとテンプレートマッチングを組み合わせて、トラックがまだ画像に残っているかどうかを確率モデル(これを計算する必要があります)と組み合わせることが最善の策です。

2

This vehicle detection paperは、低レベルの検出のためのガボールフィルタバンクを使用し、それは、SVM分類器を訓練特徴空間を作成するために応答を使用します。

この手法はうまくいくと思われ、少なくともスケール不変である。私は回転については確信していません。

1

私の最初の印象はnormalized cross-correlationです。特に、アプリケーション例として車両追跡機能を備えた純粋な光相互相関器を見たことがあります。(車両が光学部品と画像を使用して通過するのを追跡する - 私はリンクを見つけることができたと思います)これは「テンプレートマッチング」と似ていますしかし、あなたが知っているように画像が回転されていれば、これはうまくいかないでしょう。

しかし、回転、スケール、せん断、および平行移動に関係なく機能するrelated method based on log-polar coordinatesがあります。

これは、最大相関が低下するため、オブジェクトがビデオのシーンを離れたことを追跡することも可能になると考えています。

5

optical flowを画像に適用し、フローフィールドに基づいてセグメント化します。バックグラウンドフローは「オブジェクト」フロー(主に発散するか収束するかは、それがあなたに向かってまたはあなたから離れていくかどうかに左右されます。

http://users.fmrib.ox.ac.uk/~steve/asset/index.html

関連する問題