2017-03-09 12 views
-1

私は単純な数字認識プロジェクトを持っており、一般的にPythonで人々が2つのアプローチを使用することに気付きました。私の目標は、PDFドキュメントを入力して、ページの特定の場所にHANDWRITTEN桁を取得することです。Pythonでの数字認識の最も単純なアプローチ

の例に見られるように、this質問のようにopencv、またはscikitlearnのいずれかを使用することがわかりました。私はどちらかに慣れていないし、私の意図した使い方を考えれば、どの人が最も簡単に習得して実装するのか不思議です。ありがとう。

+0

「数字を取得する」とはどういう意味ですか?一般的には、任意のpdf読書ツール(pdfminerなど)を使用し、それを開いて正規表現を使用してあなたの桁を見つけることができます。私はあなたがscikitについて言及したことを考慮して、あなたがそれを意図していなかったと仮定します。 – nir0s

+0

scikit-learnの例は同じ問題を解決していません! (前処理され、切り取られた数字の分類!=数字の検索)。 – sascha

+0

私はいつもscikit-learnを推奨しています。これははるかに堅牢で、大規模なデータセットを扱う際に役立つ多くの機能を備えています。数字を取得するには、ピクセル位置に基づいて数字を切り取り、機械学習アルゴリズムに入力します。あなたは何を使用しようとしていますか? – JahKnows

答えて

1

opencvscikitlearnの両方を使用することをおすすめします。 pdfを画像に変換した後、opencvを画像前処理(ガウスぼかし、しきい値処理、エロージョン/フィルタリング)に使用すると、数字を抽出しやすくなります。その後、輪郭線追跡(opencv)を使用して個々の数字を検出することができます。あなたの桁を抽出した後(そして訓練セットを持っていると仮定すると)、分類にはscikitlearnを使用できます。

+0

ありがとう、それは便利です。私はトレーニングセットを持っていません。私は数字の一般的なトレーニングセットを見つけることができる場所はありますか? – splinter

+0

私が知る限り、最も有名な手書き数字の訓練セットは[MNIST](http://yann.lecun.com/exdb/mnist/)です。 – GStav

関連する問題