-2

私はイメージ内のオブジェクトのサイズを認識する必要があるアプリケーションを構築しています。私はキュウリの絵を読んで、キュウリが何ピクセルくらいあるかを教えてください。私は過去に画像分類器を構築しましたが、分類された画像を取得して寸法を見つける方法がわかりません。Sci-Kit Learn/Tensorflowでオブジェクトサイズを検出するにはどうすればよいですか?

私は機械学習とsci-kitの基本的な理解を学びます。どのような提案やガイドも非常に有益であり、高く評価されます。

EDIT:これはダムに聞こえるかもしれませんが、ニューラルネットワークに何かを投げて自動結果を得ることはできますか?たとえば、長さの目標を持つキュウリの画像にNNを練習し、ニューラルネットワークが画像からピクセルの長さを取得したいと思っていることを期待できますか?

+0

あなたは*画像分割を参照しています*。画像セグメンテーションおよび画像分類は、機械学習「タスク」の例である。 – guest

+0

清算をありがとう!私は少し質問を更新しました – user3647894

+0

>例えば、長さの目標を持つキュウリの画像にNNを練習し、ニューラルネットワークが画像からピクセルの長さを取得したいと思っていることを期待できますか? はいできます。これを回帰といいます。これを行う最善の方法は、まず分類DNNを構築することです。その後、完全に接続されたレイヤーを取り除き、回帰のレイヤーに置き換えます。ここで、targetはピクセル数です。しかし、あなたはトレーニングデータのshitloadを必要とします – CAFEBABE

答えて

1

あなたのユースケースに応じて、OpenCV. It has bindings for python, C, C++ and java.を使用するほうがずっと良いかもしれません。あなたのキュウリが常に同じ背景にある場合、OpenCVはこのタイプのことを行うための方法を正確に持っているので、これは私が取るルートの100%です。

何らかの理由でプロダクションでTFを使用する必要がある場合は、OpenCVを使用してニューラルネットをトレーニングするデータを準備する必要があります。キュウリのサンプル画像を準備し、OpenCVを使用してキュウリを切り取り、約50万のサンプル画像に置き換えます(多少のせん断やぼかし、あるいはその両方)。これをデータセットとして使用します。 TFにフィードする。 サイズとともにTrue/False値(キュウリかどうか)を入力できるはずです。私が知っている限り、両方を学ぶべきです。

空のシーンの画像がたくさん含まれていることを確認し、同じシーンの画像にターゲットオブジェクトが含まれていることを確認してください。理想的には、アプリケーションが実行される環境と同じ環境を使用することをお勧めします。

コメントの代わりに回答を投稿して申し訳ありません。まだ評判が足りません。

P.S. 多くの場合オブジェクトを検出するのが簡単なのは、単なる形状ではなく色を使用して行う場合です。

乾杯、 アンドリュー

+0

洞察に感謝します!私はOpenCVを調べます。残念ながら、バックグラウンドは毎回違うので、色だけでなく形状も認識しなければなりません。 – user3647894

+0

OpenCVのHaarカスケードで十分です。チュートリアルはhttps://pythonprogramming.net/loading-images-python-opencv-tutorial/にあります。 –

関連する問題