2016-04-03 11 views
2

ニューラルネットワークを使用して静止画像またはビデオストリームの距離を推定することは可能ですか?ニューラルネットワークを使用して画像の距離を推定する

私はビデオ出力と距離測定を提供するレーザーレンジャーファインダーを持っています。しかし、距離測定にはレーザーを環境に照射する必要がありますが、これは必ずしも理想的ではありません。私はこれを "パッシブ"モードに切り替えるオプションを持っています。このモードでは、画像をニューラルネットワークに供給し、レーザを起動する必要なしに距離を推定します。ネットワークは最初、アクティブモードでレンジャーファインダからの画像+距離のペアで訓練される。

私はニューラルネットワークの専門家ではありません。Googleは画像分類と姿勢推定を使用してニューラルネットワークに多くの用途を見出していますが、私は距離推定のための先行技術を見つけることができません。これは実用的なようですか、私は時間を無駄にしていますか? Nピクセルあたり1つの入力を持つ基本的なフィードフォワードネットワークで十分でしょうか、別のアーキテクチャが必要でしょうか?

+0

はい、可能です。どのようなアーキテクチャが必要でしょうか?おそらくいくつかのconv-netですが、これは明らかに調べるためにはかなりの作業が必要な研究課題です。 – lejlot

+0

したがって、任意の内容の*単一画像からの距離を見積もりたいのですか?どのようなテクノロジーを使用していても、どのように機能するのですか? –

答えて

3

はい、トレーニングのための真実のデータがあると仮定して、可能です。早ければ2006年に、この主題に関する出版物があったが、マルコフランダムフィールドを使用した。あなたはhereを読むことができます。最近ではConvolutional Neural NetworksDeep Convolutional Neural Fieldsで行われました。これらの3つの例は、画像上のすべての単一ピクセルの深さを推定するので、それらのそれぞれに対して正しい測定が必要です。

平面ファインダーを使用している場合は、レーザーの解像度に応じて、画像のさまざまな列の正確な奥行きを取得できます。これは、完全な画像ではなく、画像の1行のピクセルでNNを訓練する必要があることを意味します。シーン全体の深さを抽出するには、通常、双眼カメラやKinectのようなものを使用します(もちろん、トレーニングのためだけです)。

+0

ありがとうございます。なぜ私の検索がそれらの論文を上回らなかったのか分かりませんが、それはまさに私が探していたものです。 – Cerin

関連する問題