Pythonでイメージ内の数字を認識する方法は？

-3

私は現在、tetrisfriends.comでマシン学習を実践するためにテトリスをプレイするボットを書こうとしていますが、私は固まってしまいました。私はゲームから選手の得点を読む方法を見つけようとしているが、Tesseractはフォント/数字を認識せず、Tesseractが完全なフォントではないために数字を認識するように再考できるとは思わない使用された、ちょうど番号。Pythonでイメージ内の数字を認識する方法は？

私がこれですから数値を読み込むしようとしている画像： https://imgur.com/a/OVwV5

私はたTesseractを使用する場合、私はそれは、ページ上のパートIであるだけではない数字を他の単語を認識するために取得することができます必要。

Tesseract、他の方法、または他の方法で再学習することで、誰でもこれを行う方法がありますか？

出典

2017-11-15 malsatori

私はTesseractに特に精通していませんが、ここではうまくいかないかもしれません。最終目標がボットを作ることだけだったら、おそらくOCRについて心配するのではなく、アプリケーションから直接テキストを引き出すことができるかもしれませんが、機械学習についてもっと学びたいが、まだそれらをやっていないのなら、MNISTとCIFAR-10データセット始めるには素晴らしい場所です。

とにかく！テストしようとしている画像のコントラストは非常に低く、フォントは大きく様式化されています。それは文字のように見えるウェブサイト自体を見ると色の黄色です：黄ピクセルは黒であり、他のすべてが白であることをあなたが例えばで動作するように非常にクリーンソースを持っているでしょうので、あなたのイメージを前処理した場合

before

：

after

あなたはこのためたTesseractを推進したいと前処理が十分でない場合、あなたはおそらくこのフォントのためにそれを再教育する必要があります。コーパスを準備し、ソースデータがどのように見えるかを同様に処理し、qt-box-editorのようなものを使用してデータを修正する必要があります。このguideは、再訓練の基本的な手順を順を追って説明できるはずです。

出典

2017-11-15 18:16:05

Pythonでイメージ内の数字を認識する方法は？

答えて

関連する問題