0
私は、単語間の意味的類似度を計算するためWS4JのAPIを使用しています:依存(200MBの)
ILexicalDatabase db = new NictWordNet();
RelatednessCalculator lin = new Lin(db);
RelatednessCalculator wup = new WuPalmer(db);
String w1 = "science";
String w2 = "university";
System.out.println(lin.calcRelatednessOfWords(w1, w2));
System.out.println(wup.calcRelatednessOfWords(w1, w2));
問題はこのAPIを配置する必要があり、次の構成ファイルに依存していることですプロジェクトのディレクトリに(私は、この目的のために/resources
を使用):
jaw.jaw.conf
similarity.conf
wordnet folder
また、このライブラリは、Mavenのリポジトリで利用できないことを残念です。
ローカルプロジェクトのフォルダに上記のファイルを置かないようにする方法はありますか?これらのファイルは100Mbを超えています....
ライブラリDISCOもチェックしましたが、WS4Jほど強力ではありません。