2016-06-30 3 views
0

私は現在ツイート言語の認識方法を探しています。私はApacheライブラリのtikaを見つけましたが、うまくいきません... 今、langdetectが見つかりました。私はそれを使用しようとしています。 現在、私はコードのサンプルを発見したが、私は、ファイル「プロファイル」が何であるかを理解していない...私は私が内部に置く必要があるかわからない...LangDetectプロフィールとは何ですか?

String path = "my path to the file profiles"; 
       DetectorFactory.loadProfile(path); 
       detector = DetectorFactory.create(); 
       detector.append(tweet); 
       langDetected = detector.detect(); 

答えて

0

documentationから:

このライブラリを使用する前に、DetectorFactory#loadProfile()を1回呼び出して初期化してください。

DetectorFactory.loadProfile(profileDirectory); このメソッドのパラメータは、言語プロファイルのファイルを持つディレクトリです。 言語プロファイルはこのライブラリにバンドルされていますので、loadProfile()のパラメータとして"trunk/profile"をリポジトリに指定してください。

プロファイルファイルがprofiles subdirectory

+0

でリポジトリにあるありがとうございます!できます。私はちょうどjarファイルからプロファイルを抽出する必要がありました。 – Arya

関連する問題