画像の複雑なオブジェクトを認識する

私は状況についてより具体的に説明します：画像の複雑なオブジェクトを認識する

私はDotAのゲームからスクリーンショットをキャプチャしました。取得したい情報は、たとえばオブジェクトです。ヒーロー（名前、hp、...）、クリープ（どちら側も）、塔などが画像に表示されます。問題は、DotA 2ではこれらのオブジェクトの多くが多くの観点から見ることができるという事実から来ているので、問題を減らしてすべてのオブジェクトが1つの方向しか持たないと仮定してみましょう。どのようにしてこの問題を素早く解決すれば、約30fpsですべてのオブジェクトをリアルタイムで認識できるのでしょうか？助けや提案は大歓迎です。

出典

2016-03-25 user4034932

私はあなたに良いフラグがあると思います：イメージセグメンテーションのためのCNN。ですから、私の主なポイントは、さまざまな視点と規模の異なる多くのオブジェクト（あなたのヒーロー/オブジェクトを拡大/縮小できると思うからです）、最も簡単な方法ですオブジェクトの種類ごとに1つのCNN。

しかし、画像は問題をよりよく理解するのに役立ちます。

出典

2016-03-25 03:26:36 FiReTiTi

私が知る限り、CNNは、オブジェクトがイメージ内に存在するかどうかを判断することができますが、問題のオブジェクトが存在するイメージの位置は特定できません。これはスクリーンショットから抽出したい情報です。 CNNは実際にこれに答えることができますか？ – user4034932

CNNはどのピクセルがオブジェクトに属しているかを教えてくれるので、画像内の位置も表示されます。 – FiReTiTi

明確にするには、どの解決策を提案していますか？ 1：最初に興味深いオブジェクトをイメージから抽出し、次に各オブジェクトをCNNに送り、オブジェクトの種類を調べます。この場合、これらのオブジェクトをどのように抽出できますか？彼らはモノクロームのオブジェクトではないので、私は実際にその仕事をするアルゴリズムを知らない。 2：スクリーンショット全体をCNNにフィードすると、CNNはオブジェクトの場所とオブジェクトの種類を出力します。この場合、このようなタスクを実行できるCNNは存在しませんでした。より多くの情報やリンクが役立ちます。ありがとう。 – user4034932

画像の複雑なオブジェクトを認識する

答えて

関連する問題