porter-stemmer

    0

    1答えて

    ファイルを読み込み、ファイルのテキストのステムトークンを格納するためにPorterStemmerを使用しようとしましたが、このエラーが発生しました。 tokens=preprocessTokens(line) File "/home/fl/git/KNN/preprocessDoc.py", line 20, in preprocessTokens line=line+' '+ps.s

    0

    1答えて

    私はLuceneを使用しています。 (主に)Javaアプリケーションでテストしたところ、完全に機能しました。しかし、私のアンドロイドアプリケーション(onCreate)では動作しません。なぜ誰が知っていますか?それはのonCreateに回転させたとき、ここで がメインとエラーで、のonCreateで私のコードです:ここでは import org.tartarus.snowball.ext.Port

    0

    1答えて

    私testerfileは含まれています processes deleting agreed そして、このコードを実行した後のC# PorterStemmer testing = new PorterStemmer(); string temp,stemmed; string[] lines = System.IO.File.ReadAllLines(@"C:\\Users\\PJM\\

    0

    1答えて

    私のプロジェクトでは(pythonを使って)ポッターステマーを使っています。出力にはいくつかのエラーがあります。例えば、「intrductory」という用語は、「introduct」の代わりに「introductori」に変更されました。 この結果を改善することは可能でしょうか?

    0

    1答えて

    Stemmersアルゴリズムの逆を実行するアルゴリズムはありますか?つまり、ステム「はが必要です」を指定すると、ステム「require」ですべての単語を見つける方法はありますか? 常に同じ単語のバリエーションが見つかりました。要件、要件、必要、必要。すべてが共通して「必要」を持っています。ステム "require"ですべての単語を識別する機能を組み込むことができれば素晴らしいと思います。 私たちは

    0

    1答えて

    私はSOLRでKStem Filter Factory(KStemFF)を使用しています。私はKStemFFが100%正確ではないことに気付きました。 例では、「カード」を「カード」に置き換えません。 「サウンドカード」と「サウンドカード」が異なる結果を返します。 これはKStemFFだけで動作する方法はありますか?私は、ポーター・ステマーのような他のステムマーを使うことがこの場合に役立つかもしれ

    2

    1答えて

    私は雪球ステミングアルゴリズムを理解しようとしています。 HW90には例と同様の質問がありましたが、私のものではありませんでした。母音に続く最初の非母音の後の領域であるか、または存在する場合、単語の終わりに ヌル領域で R1:algorithmusは、以下のようにdefiniedされた2つの領域R1およびR2を使用していますそのような非母音はありません。 R2は、R1の母音に続く最初の非母音の後の

    0

    1答えて

    javaのPorterStemmerを使って動詞の基本形式を取得していますが、動詞「go」と「gambles」に問題が見つかりました。それを「行こう」と「賭ける」ことに形づくるのではなく、「碁」と「ギャンブリー」に分かれています。 -esと-edで終わる動詞を処理して、動詞の基本形式を取得できる優れたツールがありますか? wordnet javaのP.S JAWSもそうしています。ここで publ

    0

    1答えて

    ステミングワードに問題があります。私はステマを使用すると、単語がインデックス化されていない、数字だけが ある私は私のconfのが悪いと思うが、私はインターネット上で解決策を見つけることができないので、私はあなたがここで私の を助けることを願って、私のconfにあります: PUT /myindex { "settings": { "analysis": { "f

    14

    2答えて

    私は、nltkのPorterStemmerを使用して削除したいピクルスドテキスト文書を用意しています。私のプロジェクトに固有の理由から、私はdjangoのアプリケーションビューの内部にステミングをしたいと思います。 しかし、djangoビュー内の文書をステミングすると、'oed'という文字列のPorterStemmer().stem()から例外が発生します。IndexError: string i