2010-12-06 5 views
4

OCRの内容と画面のスクレイピングを行っています。私はこのように見える多くのファイルで終わります。.NETでの単純なOCRの問題C#

alt text

alt text

alt text

私がやらなければならないことは、これらのファイルにC#でいくつかの非常に基本的なOCRです。私は別のライブラリ(Tessnet2、Puma、MODI)を稼働させようとしている私の髪を引っ張っていて、C#の中からでも実行するためにさまざまな問題を抱えてきました。

あなたは何かこのシンプルなものをお勧めしますか?

ありがとうございます!

+0

Tessnet2は、最高のものと思われます。あなたはどんな問題を抱えていますか?彼らはまったく働いていないのですか、それともあなたが正しく処理することができませんか? –

+0

AlrightはTessnet2が動作していて、langファイルがありませんでした。残念ながら、それはごみのように思えます。 –

+0

シンプリシティは見る人の目の前にあり、あなたはOCRをやっている人ではないので..... – Blindy

答えて

1

OCRプログラムは、低解像度のスクリーンショットを読み取るようには設計されていません。最高の商用OCRエンジンでさえ、スクリーンショットの読み込みに問題があります。

Tesseractは、通常の状況でもまともな結果を得るには良いクリーンイメージが必要です。あなたが悪い結果を得ている理由のいくつかがあります。サンプル画像と出力結果を投稿すると、結果をよりよく説明することができます。問題には、色付きの背景、テキストゾーニングエラー、小文字、人工物などが含まれます。

読んでみたいフォントを使って訓練すれば、Tesseractの方がはるかに良い結果が得られます。