2017-03-26 11 views
0

以下はイメージ上のテキストを読むための私のpythonスクリプトです。後者のように正しく動作しない場合t+またはfとなります。この問題の対処方法を知りたいのですか? 私はまた、私が読むことを試みているファイルを添付しました。Python PILイメージがテキストが正常に動作しない

import tesserocr 
from PIL import Image 

print tesserocr.tesseract_version() # print tesseract-ocr version 
print tesserocr.get_languages() # prints tessdata path and list of available languages 

image = Image.open('test.png') 
#print tesserocr.image_to_text(image) # print ocr text from image 
# or 
print tesserocr.file_to_text('test.png') 

enter image description here

答えて

0

ただ、下記の結果をコマンドラインでTesseract 4.0.0 alphaと実行を持っています。今日SECに提出され、規制文書で

  • tesseract PILtoText.png PILtoText_out.txt -c preserve_interword_spaces=1 --psm 3 --oem 3

、アドビシステムズ社は、最高技術責任者ケビン・リンチは、今度の金曜日の として彼の休暇を取ることになることを発表しました 。 2013年3月18日に

、ケビン・リンチは誰、アドビシステムズ社のエグゼクティブ 副社長、最高技術責任者(CTO)、他の機会 ファイリングreads.Lynchを追求するために2013年3月22日の有効 株式会社、として辞任しましたその のMacromediaの買収中に2005年に同社に来て、Adobeの課金を のマルチスクリーンコンピューティング、 クラウドコンピューティング、ソーシャルメディアなどの最先端の技術分野に導いた。

年齢では、Adobeはプリントデザインのワークフローに根差していた コミュニティです。 Lynchは、DreamweaverからWeb パブリッシングへの移行を担当しました。彼はまた、アドビの リサーチ&経験デザインチームを監督し、アドビの言葉通りに、「Adobeの長期的な技術ビジョンを形作り、変革の時代に同社全体に革新を集中させる」という の報酬を得ました。

ウェブの周りの噂は、リンチの次の宛先として のAppleとピンポイントしています。それはまったく無意味な噂ではありません。 Adobeの ウェブテクノロジへの移行は、収益性がない場合は何もありませんでした。 マルチスクリーンの流動性、ソーシャルメディア、ウェブベースの ソフトウェアに関しては、コンシューマーハードウェアの巨人でもあるアップルは、援助の手を にすることができます。

大文字のFfに変換した場合を除き、テキスト画像が正しく認識されています。例えば、F休日からf休暇の最初の段落です。

Tesseract 3.xを使用している場合は、OCR結果を改善するためにTesseract 4.0にアップグレードすることをお勧めします。

+0

@sachin上記の回答を確認しましたか? – thewaywewere

関連する問題