2017-05-12 10 views
0

私はOS Xでデフォルトのeng.traineddataで動作するR Tesseractパッケージを持っていますが、他の言語は見つけられません。R Tesseractのエラー

trial <- ocr("test.png", engine = tesseract(language = "jpn", datapath="/Users/histmr/Library/R/3.3/library/tesseract/tessdata")) 

はエラーを生成します

Failed loading language 'jpn' 
Tesseract couldn't load any languages! 
Error in tesseract_engine_internal(datapath, language) : 
Unable to find training data for: jpn 

私は時々私は「TESSDATA_PREFIX環境変数」への参照を取得しますが、それがどこにあるか私にはわからない

tesseract_info() 
$datapath 
[1] "/Users/histmr/Library/R/3.3/library/tesseract/tessdata/" 

$available 
[1] "eng" "jpn" 

$version 
[1] "3.05.00" 

をチェックしました。正しいディレクトリパスを取得するには(ディレクトリ内のファイルを見ることができます)、または「TESSDATA_PREFIX環境変数」を編集するにはどうすればよいですか?

問題が

日本人ではなく、フランス語
tesseract_download("fra") 
french <- tesseract("fra") 

作品罰金と発生するようです!しかし

tesseract_download("jpn")  
japanese <- tesseract("jpn") 

がエラーに

+0

あなたは解決策を発見した支援を期待

export TESSDATA_PREFIX=/opt/local/share 

での作業のものを得ましたか。 'chi_tra'と' chi_sim'にも同じエラーがありました。 – Sati

答えて

0

を生成し、エラーメッセージError in tesseract_engine_internal(datapath, language)があなたのケースjpn.traineddataには、言語ファイルを述べ、すべての訓練を受けた言語データを格納するためのデフォルトのパスであるTESSDATA_PREFIXでは使用できません。パスを設定していない場合は、端末を開いて以下のコマンドを入力することができます。

export TESSDATA_PREFIX=/Users/histmr/Library/R/3.3/library/tesseract/tessdata/ 

このヘルプが必要です。

+0

ありがとう!問題が言語固有であることを認識したため、私は自分のクエリを更新しました –

+0

@ MarkR正しい 'jpn'トレーニングデータを 'TESSDATA_PREFIX'パスにダウンロードしていますか? – thewaywewere

+0

いいえ、不思議なフランス語ですが、日本語はありません。トレーニングデータはまったく同じディレクトリにありますが –

0

複数のTESSDATAフォルダを作成するTesseract(私はHomebrewとMacPortsを使用)の複数のインストールが考えられます。不思議なことに、Rは一見同じフォルダで幸せだったが、OSXのもとでは通常隠されていた別の場所でrootに近い。私は、これは