0
私は状況についてより具体的に説明します:画像の複雑なオブジェクトを認識する
私はDotAのゲームからスクリーンショットをキャプチャしました。取得したい情報は、たとえばオブジェクトです。ヒーロー(名前、hp、...)、クリープ(どちら側も)、塔などが画像に表示されます。問題は、DotA 2ではこれらのオブジェクトの多くが多くの観点から見ることができるという事実から来ているので、問題を減らしてすべてのオブジェクトが1つの方向しか持たないと仮定してみましょう。どのようにしてこの問題を素早く解決すれば、約30fpsですべてのオブジェクトをリアルタイムで認識できるのでしょうか?助けや提案は大歓迎です。
私が知る限り、CNNは、オブジェクトがイメージ内に存在するかどうかを判断することができますが、問題のオブジェクトが存在するイメージの位置は特定できません。これはスクリーンショットから抽出したい情報です。 CNNは実際にこれに答えることができますか? – user4034932
CNNはどのピクセルがオブジェクトに属しているかを教えてくれるので、画像内の位置も表示されます。 – FiReTiTi
明確にするには、どの解決策を提案していますか? 1:最初に興味深いオブジェクトをイメージから抽出し、次に各オブジェクトをCNNに送り、オブジェクトの種類を調べます。 この場合、これらのオブジェクトをどのように抽出できますか?彼らはモノクロームのオブジェクトではないので、私は実際にその仕事をするアルゴリズムを知らない。 2:スクリーンショット全体をCNNにフィードすると、CNNはオブジェクトの場所とオブジェクトの種類を出力します。 この場合、このようなタスクを実行できるCNNは存在しませんでした。より多くの情報やリンクが役立ちます。ありがとう。 – user4034932