2016-09-14 3 views
3

読んでthis articleテンソルを使ってキュウリを9つの異なるクラスに分類する人についてこのタイプのプロセスを多数のクラスに適用できるかどうかは疑問でした。私の考えは、レゴの部品を識別するためにそれを使用することです。テノールフローを使用してレゴブロックを識別する

現時点では、Bricklinkのようなサイトでは40,000 different parts以上の記述があるため、キュウリの例とは少し違いますが、適切かどうかは疑問です。各パーツには数百枚の写真を簡単に取り込むことはできませんが、次のプロセスサウンドは実現可能です:

  • 部品の写真を撮ります。
  • tensorflowを使用してパーツを識別しようとします。
  • 正しい部分を特定できない場合は、さらに写真を撮ってニューラルネットワークにフィードしてください。
  • 次の部分に進みます。

このように、私たちは新しい作品に出会うたびに、ネットワークの参照を「教える」ことで、次回はよりよく認識できるようにします。人間が監視している何百回もの反復の後に、テンソルフローが部品を認識できると想像できますか?少なくとも最も一般的なものは?

私の質問は馬鹿に聞こえるかもしれませんが、私は神経ネットワークにはないので、アドバイスは大歓迎です。現時点では、写真に基づいてレゴの部分を特定する方法は見つかっておらず、この「キュウリの例」は有望であると思われるので、私はいくつかのフィードバックを求めています。

ありがとうございました。

+0

あなたは非常に少なくとも、あなたは、トレーニング画像 – Eric

答えて

1

あなたはジャック・Mattheijの作品を読むことができ、実際に彼Xception のカスタマイズ版をhttps://keras.io/で実行しています。

紹介はSorting 2 Metric Tons of Legoです。あなたが読むことができるSorting 2 Tons of Lego, The software Side

を次回に対処するのは難しい課題は、訓練を取得することでしたが可能1000の+のクラスで作業させるのに十分な大きさ を設定します。最初はこの は克服できない問題のようでした。私は の画像を作成し、許容時間内に手作業でラベルを貼る方法を見つけられませんでした。 最も楽観的な計算では、私が6ヶ月以上働いていた フルタイムのデータセットを作成しました。 machine to は、カップルではなく、多くのクラスのクラスで動作します。

最後に、私が最後に手がかりをつける前に、解決策は少なくとも1週間は顔の中で私を見つめていた:それは問題ではない。重要なのは、 マシンが自分のイメージにラベルを付けることです。ほとんどの場合、必要なのは です。間違いを修正するだけです。それが良くなるにつれて、 の間違いが少なくなります。これにより、トレーニング画像の数が急速に拡大しました。 最初の日、私は約500部の手書きラベルを手に入れました。翌日 マシンには2000件が追加され、約半分が間違っています。 結果の2500部は、次のラウンドの基礎が3日後に のトレーニングの基礎となり、その結果、4000個の部分が生じ、その90%が とラベルされました!だから、ちょうど400部、リンス、 リピートを修正しなければならなかった...だから、2週間後には、20K画像のデータセットがありました。 すべてが正しくラベル付けされています。

は、これは十分から、いくつかのクラスはひどく過小代表 ので、私はおそらく私が ちょうど 機械を通してそれらの部分が、何からなる単一のバッチを実行します、それらのための画像の数を増やす必要があるさ。訂正の必要はなく、すべて同じように というラベルが付けられます。

最新のアップデートはSorting 2 Tons of Lego, Many Questions, Resultsです。


CHOLLET, François. Xception: Deep Learning with Depthwise Separable Convolutions. arXiv preprint arXiv:1610.02357, 2016.

+0

おかげアレッサンドロを生成するために使用することができ、すべての部品の3次元CADモデルを持っていることを忘れないでください、私はこのブログの記事を逃していたが、彼はそうです言い換えれば、ソリューションがTensorflowよりも効率的だったので、私はこの答えを受け入れることにしました。ありがとう。 – Sylvain

0

IBM WatsonのVisual Recognitionを使用してこれを開始しました。 私は6つの異なるレンガを搬送ベルトの背景に認識させました。

私はテンソルフローを実際に考えています。なぜなら、私はそれをローカルで実行できるからです。

コードラボ:詩人のためのTensorFlow、ワトソンバージョンのデモのために、あなたが達成したい、ほぼ正確に何

について説明します。 https://www.ibm.com/developerworks/community/blogs/ibmandgoogle/entry/Lego_bricks_recognition_with_Watosn_lego_and_raspberry_pi?lang=en

関連する問題