2017-04-17 8 views
8

私は、カードイメージを再生する価値とスーツをより確実に認識できる方法が不思議です。ここでは2つの例を示します。フォント以外の記号については、訓練を受けることができますか?

enter image description here enter image description here

あり、画像の一部のノイズで、私は、私はトレーニングのために使用することができ、画像の大規模なデータセットを有することができる(すべての値を含むおよそ10K PNG画像、&スーツ) 。

ハッシュ法を使用して完全一致がわかっている場合は、手動で分類した画像を確実に認識できます。しかし、私はその内容に基づいてイメージをハッシュしているので、わずかなノイズがハッシュを変更し、イメージが未知として扱われます。これは、さらなる自動化で確実に対応するために私が探しているものです。 https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract#automated-method

のみのフォントで見つけた画像を用いて学習することができますたTesseract:

私は訓練たTesseractの3.05ドキュメントを検討してきましたか?あるいは、私はそれを使ってこれらのカードのスーツを認識できますか?

私は、このフォルダ内のすべての画像が4cに対応していると言いたいと思っていました(例えば、上の画像の例)、テッセラクトはその画像の将来のインスタンス(ノイズに関係なく)それは4cと同じです。これは可能ですか?誰もがこれについての経験がありますか?

答えて

0

これは、誰かがより良い方法を証明するまで、これに私の非tesseractソリューションでした。私はセットアップをしました:

ランニングにこれらを取得するには最も難しい部分でした。次に、新しいCaffeネットワークを訓練するために私のデータセットを使用しました。桁以内

./card 
./card/2c 
./card/2d 
./card/2h 
./card/2s 
./card/3c 
./card/3d 
./card/3h 
./card/3s 
./card/4c 
./card/4d 
./card/4h 
./card/4s 
./card/5c 
./card/5d 
./card/5h 
./card/5s 
./card/6c 
./card/6d 
./card/6h 
./card/6s 
./card/7c 
./card/7d 
./card/7h 
./card/7s 
./card/8c 
./card/8d 
./card/8h 
./card/8s 
./card/9c 
./card/9d 
./card/9h 
./card/9s 
./card/_noise 
./card/_table 
./card/Ac 
./card/Ad 
./card/Ah 
./card/As 
./card/Jc 
./card/Jd 
./card/Jh 
./card/Js 
./card/Kc 
./card/Kd 
./card/Kh 
./card/Ks 
./card/Qc 
./card/Qd 
./card/Qh 
./card/Qs 
./card/Tc 
./card/Td 
./card/Th 
./card/Ts 

、私が選んだ:私は、単一の深さのフォルダ構造の中に私のデータセットを用意し

  1. データセット]タブ
  2. 新しいデータセットの画像
  3. を分類
  4. 私にそれを指摘しました/ path/to/card
  5. ここでの議論に基づいて、検証率を13.0%に設定しました:https://stackoverflow.com/a/13612921/880837
  6. データセットを作成した後、モデルタブを開きました
  7. 新しいデータセットを選択しました。
  8. 標準ネットワークの下でGoogLeNetを選択し、訓練のためにそれを残しました。

データセットに新しい画像があるたびに、これを何度か繰り返しました。各学習セッションは6〜10時間かかりましたが、この段階では私のカフェモデルを使用して、次のロジックを使用して各画像がどのようなものになるかをプログラムで推定できます。等)、雑音、またはテーブル。 90%を超える精度を持つ推定値は正しい可能性が高いです。最新の画像は、400枚の画像のうち300枚を間違いなく正しく認識しました。新しい画像をデータセットに追加して既存のモデルを再学習し、結果の精度をさらに調整します。これが他人にとって価値があることを願っています!あなたがより多くを学ぶことに興味があるなら

私はここにハイレベルの手順を望んでいたが、これはすべてのデビッド・ハンフリーと彼githubのポストに大きなおかげで行われていた、私は実際にそれを読んで、それを試してお勧めします。https://github.com/humphd/have-fun-with-machine-learning

関連する問題