私は単純な数字認識プロジェクトを持っており、一般的にPythonで人々が2つのアプローチを使用することに気付きました。私の目標は、PDFドキュメントを入力して、ページの特定の場所にHANDWRITTEN桁を取得することです。Pythonでの数字認識の最も単純なアプローチ
の例に見られるように、this質問のようにopencv
、またはscikitlearn
のいずれかを使用することがわかりました。私はどちらかに慣れていないし、私の意図した使い方を考えれば、どの人が最も簡単に習得して実装するのか不思議です。ありがとう。
「数字を取得する」とはどういう意味ですか?一般的には、任意のpdf読書ツール(pdfminerなど)を使用し、それを開いて正規表現を使用してあなたの桁を見つけることができます。私はあなたがscikitについて言及したことを考慮して、あなたがそれを意図していなかったと仮定します。 – nir0s
scikit-learnの例は同じ問題を解決していません! (前処理され、切り取られた数字の分類!=数字の検索)。 – sascha
私はいつもscikit-learnを推奨しています。これははるかに堅牢で、大規模なデータセットを扱う際に役立つ多くの機能を備えています。数字を取得するには、ピクセル位置に基づいて数字を切り取り、機械学習アルゴリズムに入力します。あなたは何を使用しようとしていますか? – JahKnows