2012-02-13 12 views
6

OCR認識とPythonのどちらにもちょっと新鮮です。Pythonで画像を認識する

私が達成しようとしているのは、TesseractをPythonスクリプトから実行して、.tifの特定の数字を「認識」することです。

私はTesseractのためにいくつかのトレーニングをすることができたと思っていましたが、私はGoogleとここでは似たような話題は見つかりませんでした。

基本的には、いくつかの画像(「矢印」、「花」などのアイコン)を含むいくつかの.tifがあり、そのアイコンの名前を出力として出力するようにします。矢印が見つかった場合は、「矢印」を印刷します。

実現可能ですか?

+0

http://code.google.com/p/pytesser/をご覧ください。 –

+0

イメージ内のアイコンやテキストのみを認識しますか?あなたが知っている限り、それを訓練する方法はありますか? – KingBOB

+0

図の背後に背景がありますか、向き、サイズ、色が変わりますか?より多くの情報を私たちはより良い私たちが助けることができます – P2bM

答えて

1

これは決して完全な答えではありませんが、tifに複数の画像があり、事前にサイズを知っている場合は、画像サンプルを分類する前に標準化することができます。あなたは、tif内のすべての可能な矩形に画像をカットします。

したがって、分類子を作成すると(ここではその方法については言及しません)、最終結果はすべての小さな矩形を分類する合成を行います。

tifが指定されている場合、「矢」または「花」の画像は16ピクセル×16ピクセルです。たとえば、 Python PILを使用してサンプルを作成できます。

from PIL import Image 

image_samples = [] 

im = Image.open("input.tif") 
sample_dimensions = (16,16) 

for box in get_all_corner_combinations(im, sample_dimensions): 

    image_samples.append(im.crop(box)) 


classifier = YourClassifier() 

classifications = [] 

for sample in image_samples: 
    classifications.append (classifier (sample)) 

label = fuse_classifications (classifications) 

また、私は実際にYourClassifierを書く学習ステップについては言及しませんでした。しかし、うまくいけば、これは問題の一部をレイアウトするのに役立ちます。

画像を分類して分類する前に、画像のノイズを掃除するだけでなく、画像を分類することについての学習のテーマについて多くの研究があります。

この素晴らしいPythonマシンラーニングライブラリのコレクションを閲覧することを検討してください。

http://scipy-lectures.github.com/advanced/scikit-learn/index.html

だけでなく、画像に関連する多くの技術があります。

関連する問題