2017-01-25 19 views
0

内の液体レベルなどの詳細を分類するために使用されるべきではdeep learning classification正確label/classifyオブジェクトとその機能の1の両方に使用することができます。 (グランツウィスキー等)ボトルを識別し(10%ステップで - フル50%など)ボトル内の液体レベルに例えば。これはいくつかのdeep learning frameworks(Tensorflowなど)または他のアプローチを利用して最も効果的に解決できる問題ですか?が深い学習分類は、このようなボトル

+1

「深い学習分類を使用する必要があります」と尋ねる必要があります。今日では、すべてのCV問題は深い学習を使って解決されなければならないと思われ、人々は問題を過度にしてはならないことを忘れてしまいます。 –

+0

私はPedroに同意します。それは、深い学習を使用するべきか、あるいは質問の本文で他のアプローチを使用すべきかどうか尋ねた理由です。私は今質問のタイトルを変更しようとします。 – vladimirp

+0

事は、その仕事を徹底的に学ぶためには、何千ものラベル付き写真を収集して、それを学ばなければならないということです。私はあなたが答えの一つで提案されたいくつかの単純なグラジエントアプローチを試みるべきだと思います。 –

答えて

1

これは、液がよく着色している​​場合は、これが可能でなければなりません。そうでない場合(例:ジン、ウォッカ)、自然な視野角と距離からオブジェクトを観察するとき、今日の技術ではチャンスがないと言いたいと思います。

着色液の場合、私は2つの検出器を訓練します。 1つはボトルを検出するためのもので、もう1つはボトルに与えられた液を検出するものです。両者の比率があなたの割合になります。

実績のある最先端の深い学習ベースのオブジェクト検出器(Googleだけそれら)のいくつか:

  • マルチボックス
  • YOLO
  • RCNN

速いですかノンディープ学習ベース:

  • 変形可能部分モデル

EDIT:

は、私はもっと手の込んだように依頼しました。ここに例があります:

ボックス検出器。あなたのボトルの相対的な位置である[0.1,0.2,0.5,0.6](min_height、min_width、max_height、max_width)に画像内のボックスを描画します。

元の画像からボトルを切り抜き、2番目の検出器に送ります。第2の検出器は、例えば、 [0.2、0.3、0.7、0.8]は、切り取ったボトルの画像で、検出された液体を示します。 Now(0.7 - 0.2)*(0.8 - 0.3)= 0.25は、ボトルの面積に対する流体の相対的な面積で、OPが求めているものです。

EDIT 2:

私はOPが深い学習を使用したいと仮定すると、この応答に入りました。私はOPが深い学習でまだ不確かであるならば、他の方法も考慮すべきだと思う。ボトル検出のために、深い学習に基づく方法は、伝統的な手法よりも大幅に優れていることが示されています。ボトル検出はPASCAL VOCチャレンジのクラスの1つとなります。ここでの結果の比較を参照してください:http://rodrigob.github.io/are_we_there_yet/build/detection_datasets_results.html#50617363616c20564f43203230313020636f6d7034

しかし、液体検出のために、深い学習はやや過剰です。例えば。あなたが探している色が分かっていれば、単純なカラーフィルターでさえ「何か」を与えるでしょう。

+0

'2人の比率があなたのパーセントになります.'どのようにして酒の中の酒の割合を特定できますか?あなたはもっと詳しく説明できますか? – mwweb

+0

例を追加しました。それが役に立てば幸い。 – guinny

1

深い学習のための経験則は、画像に見える場合、専門家ができますあなただけの画像に基づいて答えを教えて、あなたは十分な注釈付きのデータを与え、深い学習でこれを学ぶことができるチャンスは非常に高いです。

しかし、あなたはそのようなタスクに必要なデータを必要とすることはほとんどありませんので、問題を簡略化できるかどうか質問します。たとえば、ジーン、ウォッカなどを取ってSIFTを使って新しいシーンでボトルを再度見つけることができます。次にRANSACでボトルを検出し、ボトルを画像から切り取ってください。

次に、液体のレベルでエッジを見つけるためにグラデーション機能を試してみましょう。最後に、(液体の端部 - 底部)/(上部のボトル ​​- 下部のボトル)でパーセンテージを計算することができます。ボトルのラベルが行うのは難しいことではありません特定

0

- それは「タップで」でも利用できる安価なため(these guysが実際に彼らのウェブサイト上でワインボトルのラベルを識別するためにそれを使用する):https://aws.amazon.com/blogs/aws/amazon-rekognition-image-detection-and-recognition-powered-by-deep-learning/

液体のレベルに関しては、このAWSがすぐには解決できない問題かもしれませんが、カスタムCNNを作成することは可能でしょうか。また、Amazon Machine Mechanical Turkの古き良き人間を使って作業することもできます。

(注:私はAmazonではうまくいきません)

関連する問題