stemming

    1

    1答えて

    私はNLTKを初めて使用しており、ステミングケースでステマー機能を使用しています。 私は処理する簡単な例文を持っています: "ライトオンをオンにする"。私は、NLTKステマーがタイプミス「ライトイン」を除外するのに役立つかどうかを見たいと思っています。私は "ライティング"でステマーをテストしました。そしてsnowBallステマーは正しい単語 "light"を返しますが、snowBallステマーは

    3

    1答えて

    私はPythonで作業しています、そして、私はいくつかの言葉の根を見つけることを望みます、それは主に国を参照しています。私が必要とするものを示すいくつかの例は以下の通りです: スペインは私にスペインを与えるべきです。 英語は私にイギリスを与えるべきです。 アメリカ人は私にアメリカを渡すべきです。 ナイジェリアはナイジェリアを私に渡すべきです。 ギリシャ語(複数形)はギリシャ語を教えてください。 プ

    0

    2答えて

    内のすべての単語の最長共通文字列プレフィックスは、すべての値がリストにして開始すること最長の文字列(の長さ)を返す関数があります取得します4 この場合:["flexible","flexile","flexion","flexor","ape"]、空の文字列または0を返します。

    1

    1答えて

    私はアプリケーションをdtSearchからelasticsearchに移動する過程にあり、エンドユーザーのプロセスを変更することなく同じ機能を維持したいと考えていました。私が問題を抱えている主な原因は、ステミングです。私たちは、ユーザがスクリーンショットdtSearch形式で自分の語幹ルールを指定することができます:3は、先行する文字の数がある 3+ies -> y 3+ing -> は、i

    2

    1答えて

    私は一連の文書を持っています。これらの文書にその単語のtfidfを数えることができるように、 tfidf-numberのベクトルで表されます)。 WordNetLemmatizer.lemmatize(word)を呼び出してからPorterStemmerを呼び出すだけで十分だと思ったが、すべて 'have'、 'has'、 'had'などはlemmatizerによって 'have'それは他の言葉に

    0

    2答えて

    cts:stem('motivation', 'en')のステミング結果はmotivationです。私は結果がmotivateであることを期待しています。これを解決するには? http://docs.marklogic.com/guide/search-dev/stemmingによると

    14

    2答えて

    私は、nltkのPorterStemmerを使用して削除したいピクルスドテキスト文書を用意しています。私のプロジェクトに固有の理由から、私はdjangoのアプリケーションビューの内部にステミングをしたいと思います。 しかし、djangoビュー内の文書をステミングすると、'oed'という文字列のPorterStemmer().stem()から例外が発生します。IndexError: string i

    0

    1答えて

    私はテキスト解析を実行するための簡単なコードを持っています。 DTMを作成する前に、私はstemCompletionを適用しています。しかし、これの出力は、私が間違っているかどうか、あるいはそれが動作する唯一の方法であるかどうか、私が理解していないものです。 私はRMY助けのこのリンクを参照している:私はここを参照してくださいtext-mining-with-the-tm-package-word

    1

    1答えて

    ワード長が、私は位置0の文字位置の文字を削除したい5.では、3パイソンと はこのように思える:は word = word[1:3] + word[4] #this is with python 質問は、私が行うことができますされてどのようにそれは雪のボールで?

    0

    3答えて

    私は文字列のリストと接尾辞のリストを持っています。文字列に接尾辞のいずれかが含まれている場合、その特定の文字列を文字列から削除するにはどうすればよいですか? b = ["food", "stuffing", "hobbitses"] y = ["ing", "es", "s", "ly"] def stemming(): for i in range(len(b)):