私はアラビア語のJavaステマーを探しています。 "AraMorph"と呼ばれるライブラリが見つかりましたが、その出力は制御不能であり、望ましくない単語を形成します。私はJavaのアラビア語ステマをしたい
アラビア語の他の語幹はありますか?
私はアラビア語のJavaステマーを探しています。 "AraMorph"と呼ばれるライブラリが見つかりましたが、その出力は制御不能であり、望ましくない単語を形成します。私はJavaのアラビア語ステマをしたい
アラビア語の他の語幹はありますか?
私は最善の解決策は、そのようポーターアルゴリズムを使用して独自のステマーを実装することです見つけ掘り後ステマーを調整することができます
何ですか?それは動作しません!アラビア語は非ラテン文字で入力され、さらに重要なことに、他のラテン語とは非常に異なるアルゴリズムアプローチに従います。 ....しかし、私はそれがあなたと一緒に働いたかどうかを知ることに興味がありますか? –
https://sourceforge.net/projects/arabicstemmer/
これはShereen Khojaアルゴリズムに基づいています。
あなたはElkhojaステマーやLuceneのlight stemmer
ある新しいアラビア語のステマーのいずれかを使用することができます。Javaを含む多くの言語に雪玉フレームワークを使用して符号化し、生成Assem's Arabic light stemmer。 libstemmer for Java hereをダウンロードして使用することができます。
答えていただきありがとうございます、@paradigmatic。私はステミングが何であるか分からなかったので私の質問に答えました。あなたの答えに続いて、私はそれについて少し読んだ。 – AlexR
私は自分のプロジェクトで使うことができるようにAPIまたはLibが必要です ありがとうございました:) –
@Kareem:APIまたはlibです...私が投稿した2番目のリンクを確認してください。 – paradigmatic