2010-11-29 15 views
4

私の最終論文私は、色と奥行き情報を組み合わせて3D顔認識システムを構築しようとしています。最初のステップは、反復最近点アルゴリズムを使用して、指定されたモデルヘッドにデータヘッドを再配置することです。検出ステップのために、私はlibsvmの使用について考えていました。しかし、深さと色情報を1つの特徴ベクトルに結合する方法を理解していませんか?彼らは依存する情報です(各点は色(RGB)、奥行き情報、スキャン品質で構成されています)。何をすることをお勧めしますか?重み付けのようなもの?機械学習 - SVM機能融合テクニック

編集: 昨夜私はSURF/SIFT機能に関する記事を読んでいます。私はそれらを使いたいです!それは働くことができますか?概念は次のようになります:カラー画像と深度画像(距離画像)からこの特徴を抽出し、各特徴をsvmの単一の特徴ベクトルとして使用するか?

+0

Steveが言ったように、2つのベクトルを連結します。私はPCAを実行します。 – Eamorr

+0

最後の夜私はSURF/SIFT機能に関する記事を読んでいます。私はそれらを使いたいです!それは働くことができますか?概念は次のようになります: - この特徴をカラー画像および深度画像(距離画像)から抽出する – Ben

答えて

1

簡単なことですが、2つのベクトルを連結して1つのベクトルにするだけです。多くの研究者がこれを行っている。

4

実際には連結可能性があります。しかし、あなたが3D顔認識に取り組んでいるとき、あなたはそれについてどうやって行くのかに関するいくつかの戦略を持っているべきです。顔の回転と平行移動は、「直接的」アプローチを使用して認識するのが難しいでしょう。

顔全体の検出を実行するか、サブ機能の検出を実行するかを決定する必要があります。あなたは、いくつかの中心的な特徴(目、鼻など)を見つけることによって回転を検出しようとすることができます。

また、SVMは本質的にバイナリである(つまり、2つのクラス間で分離する)ことに注意してください。あなたの正確なアプリケーションに応じて、いくつかのマルチクラス戦略(1対1または複数対1対多)を採用する必要があります。

他の人がこの問題をどのように攻撃したかを見るために、いくつかの文献調査を行うことをお勧めします(Google検索は良いスタートになります)。

0

あなたが到着したのは重要な未解決の問題です。はい、ここでEamorrが述べたように、それを扱ういくつかの方法があります。たとえば、PCA(またはいくつかのnon linear dimensionality reductionメソッド)を連結して実行することができます。しかし、PCAが機能の数でO(n^3)時間かかることを考えると、そうすることの実用性を守るのは難しいことです。これだけでは、何千もの機能を持つ可能性のあるビジョンのデータには不合理なことがあります。

0

他の人が述べたように、最も簡単な方法は、2つの機能セットを1つに単純に組み合わせることです。

SVMは、マージンが超過している超平面に特徴的であり、そのコンポーネントがフィーチャの重み付け/重要度を指定するため、絶対値の高い方が決定関数に大きな影響を与えます。したがって、SVMはすべての機能にそれぞれ独自の重みを割り当てます。

これを行うには、明らかに、すべての属性を[-1,1]または[0,1]の範囲に変換するなど、すべての属性を同じ縮尺で正規化する必要があります。