私が見つけたさまざまな文献を見直していたとき、カメラモデルが正射投影であると仮定した動きからの構造、他のリソースは透視投影でした。 2つの異なる技術に従っています。動きからの構造の正射投影カメラモデルと透視カメラモデルは、どのように異なっていますか?
誰かがその経験を共有できますか?
私が見つけたさまざまな文献を見直していたとき、カメラモデルが正射投影であると仮定した動きからの構造、他のリソースは透視投影でした。 2つの異なる技術に従っています。動きからの構造の正射投影カメラモデルと透視カメラモデルは、どのように異なっていますか?
誰かがその経験を共有できますか?
静的シーンと移動カメラ(または同様に、シーンと静的カメラを厳密に移動する)があり、2つ以上の画像からシーンのジオメトリとカメラの動きを再構成したいとします。再構成は、通常、点の対応を取得することに基づいています。つまり、ポイントとカメラの動きについて解決すべき方程式がいくつかあります。
解決策は、非線形最小化またはさまざまな近似に基づいています。カメラは、正投影または透視投影で近似することができます。最も単純なSFMの場合、カメラは正射投影法(またはより一般的には弱い透視投影法)によって近似することができ、場面をスケールアップすることができる。しかし、正射投影の特性のために、画像平面に垂直な平行移動は決して回復できない。
新しいSfM方法は、正射投影法ですべての情報を復元できないため、透視投影法を使用します。完全な透視投影では、例えば光軸に沿った平行移動を回復することができる。それはジオメトリであり、フルモーションはグローバルスケールファクタまで回復できます。
それぞれの方法が選択された理由を理解するためには、カメラのモデルを正射投影としてモデル化し、それをパースペクティブとしてモデル化するときにカメラのモデルを見る必要があります。
射影中心からのシーンの距離が無限であると仮定した場合、正射投影カメラモデルは特殊なケースです。これは、物体と画像との間の距離に起因する歪みがないと仮定していることを意味する。結果として、現実世界の物体座標と画像の物体座標との間の同一性を得ることが期待される。
たとえば、座標(X1、Y1、Z1)、(X2、Y2、Z2)、(X3、Y3、Z3)の三角形が現実世界にある場合、画像上の三角形(x1、y1)、(x2、y2)、(x3、y3)は、X1 = wx1X2 = w x2であった。 wはスケーリング係数です。
いつこれが良い仮定ですか?各点のZ値を考慮しなかったことに注意してください。カメラからのシーンの距離がほぼ一定であるシーンを見ると、この仮定は良いことです。
注:これは、カメラ自体のレンズ歪みなどのような他の要因を考慮に入れていない非常に単純な説明です。
特にお返事ありがとうございます。私は、正書法や視点法を前提としてメソッドを使うかどうかをアプリケーションのために決める方法はまだ不思議です。正射モデルを使用するほうが良い場合はアプリケーションの例を、多分遠近法モデルを使用する場合は可能性がありますか? –
あなたの答えは@Kornelありがとうございます。したがって、光軸に沿った動きがないと仮定すると、この場合、近い結果をもたらすと考えることができるか? –
シーンにはほとんど依存しませんが、正射投影のSfMは、3次元オブジェクトの小さなZ相対移動(画像内を移動する)には非常に便利だと思います。 – Kornel
あなたは私にそれを紹介する可能性のある正射投影モデルを適用して、良いチュートリアルにぶつかりましたか? –