1
私はTesseract OCRをインストールしました。コマンド$ tesseract --list-langs
を実行した後、出力には2言語、eng
とosd
しか表示されませんでした。私の質問は、私の場合、具体的には、別の言語、どのように読み込むのですか?Tesseract OCR言語を読み込んでいます - 日本語
私はTesseract OCRをインストールしました。コマンド$ tesseract --list-langs
を実行した後、出力には2言語、eng
とosd
しか表示されませんでした。私の質問は、私の場合、具体的には、別の言語、どのように読み込むのですか?Tesseract OCR言語を読み込んでいます - 日本語
私は、すなわち、https://github.com/tesseract-ocr/tessdataから訓練されたデータをつかみ、他の訓練されたデータと同じディレクトリに置くことであることを学んだeng.traineddata
と言語フラグに-l LANG
たTesseractを渡すことで、指定した言語を読むことができるはずです次の例では、日本語:tesseract -l jpn sample-jpn.png output-jpn
です。