構造化キーポイント

背景構造化キーポイント

Iポーズ（足、足首、膝、腕、頭、等）と接続するためのキーポイントを出力するニューラルネットワークを有していて - 基本的にI骨格がある。これらの重要なポイント/スケルトンを、別のニューラルネットワーク、つまり関係ネットワーク（https://arxiv.org/pdf/1706.01427.pdf）への入力として使用したいと思います。目標は、ポーズと異なるオブジェクトとの関係を学習することです。

質問

私がキーポイントで働いているので、私はそれらを構築するための最良の方法は、入力として何であるかわかりません。私は、値が1に設定されているスケルトンで覆われていない限り、キーポイントを画像に変換することを考えました。しかし、それは非効率的です。パフォーマンスを損なうことなくイメージを使用する（畳み込みネットを使用できる）ための構造上の利点を保持する方法はありますか？

出典

2017-09-21 megashigger

あなたの "オブジェクト"がイメージの場合、私はそのスケルトンイメージを作ることが最善であると信じています....しかし、あなたはオブジェクトにキーポイントを持っていれば、キーポイントだけで作業しようとする可能性があります.... –

オブジェクトはキーポイントでもあります。しかし、キーポイントだけで作業するのはどういう意味ですか？それは、（1）キーポイントのX、Y座標のみ、（2）キーポイントのX、Y座標、それらを接続する線上のすべての位置、または何か他の意味ですか？また、他のすべての座標が0に設定されている画像を使用するか、そのままキーポイントを使用しますか？ – megashigger

私は準備ができている解決策はありません....しかし、私はそれを試そうとします...多分あなたは線を定義しなければなりません（面を持たない場合は点の組）。しかし、実際には、未使用ポイントについて何かを作る必要があります。 –

"画像"を扱うときにはるかに多くのツールにアクセスできるように、テンソルHxWテンソルに保存することを提案する必要があります。

あなたのパフォーマンスニーズと重要なポイントの量によっては、Sparse Tensorsでも値が0でないと考えることもできますが、必要なオプションが特殊なスパンテンソル操作で完全にサポートされているかどうかを確認する必要があります。

出典

2017-09-21 17:53:21 bodokaiser

答えて

関連する問題