2

背景構造化キーポイント

Iポーズ(足、足首、膝、腕、頭、等)と接続するためのキーポイントを出力するニューラルネットワークを有していて - 基本的にI骨格がある。これらの重要なポイント/スケルトンを、別のニューラルネットワーク、つまり関係ネットワーク(https://arxiv.org/pdf/1706.01427.pdf)への入力として使用したいと思います。目標は、ポーズと異なるオブジェクトとの関係を学習することです。

質問

私がキーポイントで働いているので、私はそれらを構築するための最良の方法は、入力として何であるかわかりません。私は、値が1に設定されているスケルトンで覆われていない限り、キーポイントを画像に変換することを考えました。しかし、それは非効率的です。パフォーマンスを損なうことなくイメージを使用する(畳み込みネットを使用できる)ための構造上の利点を保持する方法はありますか?

+0

あなたの "オブジェクト"がイメージの場合、私はそのスケルトンイメージを作ることが最善であると信じています....しかし、あなたはオブジェクトにキーポイントを持っていれば、キーポイントだけで作業しようとする可能性があります.... –

+0

オブジェクトはキーポイントでもあります。しかし、キーポイントだけで作業するのはどういう意味ですか?それは、(1)キーポイントのX、Y座標のみ、(2)キーポイントのX、Y座標、それらを接続する線上のすべての位置、または何か他の意味ですか?また、他のすべての座標が0に設定されている画像を使用するか、そのままキーポイントを使用しますか? – megashigger

+0

私は準備ができている解決策はありません....しかし、私はそれを試そうとします...多分あなたは線を定義しなければなりません(面を持たない場合は点の組)。しかし、実際には、未使用ポイントについて何かを作る必要があります。 –

答えて

0

"画像"を扱うときにはるかに多くのツールにアクセスできるように、テンソルHxWテンソルに保存することを提案する必要があります。

あなたのパフォーマンスニーズと重要なポイントの量によっては、Sparse Tensorsでも値が0でないと考えることもできますが、必要なオプションが特殊なスパンテンソル操作で完全にサポートされているかどうかを確認する必要があります。