OCRの高速スクリーンフォントを実行するために使用できる技術やAPIがあるかどうかを知りたいですか?高速スクリーンフォントOCRテクニックまたはAPI?
は、以下のことが当然視されています
- はOCRにテキストがスクリーンショットから来るものと
- OCRにテキストがまたはアンチエイリアス処理であってもなくてもよいスクリーンフォントを使用してレンダリングされなければならない
- アンチエイリアシングスクリーンショットRGBまたはRBGため
- であってもよく、ベースライン(単にすべての画面Fを見る見つけるために自明であるRGBデシメーション(等ClearTypeの別名別名サブピクセルAA)
- を使用することができるかどうか
- 多くのエラーが許容されます(文字認識は100%正確である必要はありません)
- フォントは基本的には事前にわかっていますが、どのように正確にフォントはレンダリングされません(サイズは不明です、色は不明です、アンチエイリアスのタイプは不明です)。 (各文字が行うことは非常に簡単であるベースラインと「切断」を見つける:基本的に何を知られていること、だから私はそれが「本当の」OCRを行うように複雑としての近くにどこにもありませんと仮定し、非常に一般的なフォント
になるだろうということです私はすでにそれをやった)。
誰も特定の技術や論文、あるいはAPIを知っていますか?
注意:この質問はではなく、のスクリーンスクレイピングについてです。この質問は、ではなく、でCAPTCHAを破ることです。この質問はではありません。通常のOCRについてはです(スキャンされたテキストをOCRする場合など)。この質問は、ではなく、です。GUIオートメーションについて説明しています。
**タグの提案**この問題は、GUI自動化に関するものであれば、gui-automationタグを追加してください。これがあなた自身の開発を計画しているOCRアルゴリズム技術についてのものであれば、アルゴリズムタグを追加してください。この目的のために設計されたオープンソースのOCR実装をお探しの場合は、オープンソースのタグを追加してください。 – rwong
あなたの状況にこの質問に対する回答があるかどうかを確認してください。http://stackoverflow.com/q/896224/377657 – rwong
これで進歩はありましたか?私は同じことをやろうとしていますが、画面上のフォントで文字がまったく同じであることがわかりました。これは便利な機能です。私。 "a"は画面上の異なる位置で "a"と同じように見えます。 – Phil