pos-tagging

0熱

2答えて

私はテキストマイニングとNLP関連のものを初めて使っています。私はいくつかのドキュメントから情報を抽出しようとしている小さなプロジェクトに取り組んでいます。私は基本的にposタグ付けを行い、次にパターンを見つけるためにこのPOSタグ付けを行う前にストップワードを使用する必要がありますか？ストップワードを使用するとPOSタグリーダーの精度に影響しますか？

8熱

3答えて

NLTKのpos_tagの使用

私はNLTKでスピーチタギングを使用しようとしていますし、このコマンドを使用しています >>> text = nltk.word_tokenize("And now for something completely different") >>> nltk.pos_tag(text) Traceback (most recent call last): File "<pyshell#4>

0熱

1答えて

平均POS-TAG頻度

私はこのタグ付きテキスト（そのように書式設定された）をとり、各文のposタグDTの平均頻度を探したいと思います。例。 DTは文1では1/3語、文2では1/3語である。次に、これらを追加して、テキストの文章数（この例では2）で割ります。これにより、1文につきDTの平均的な出現が得られます。 from collections import Counter import nltk tagged_t

7熱

1答えて

c/C++ NLPライブラリ

私はc/C++用のオープンソースのNatural Language Processingライブラリを探していますが、特に私はPartial of speech taggingに興味があります。

1熱

2答えて

2つのPOSタグをチェックする方法はNLTKの同じカテゴリにありますか？

タイトルと同様に、2つのPOSタグが同じカテゴリにあることを確認するにはどうすればいいですか？例えば、 go -> VB goes -> VBZ これら二つの単語の両方動詞です。または、 bag -> NN bags -> NNS これら2つはともに名詞です。私の質問は、2つの特定のタグが同じカテゴリにあるかどうかをチェックするためのNLTKの関数が存在するかどうかです。

8熱

2答えて

テキストから名詞+名詞または（adj |名詞）+名詞を抽出する

RのopenNLPパッケージで名詞+名詞または名詞+名詞を抽出することができるか照会したいですか？候補の名詞句を抽出するために言語フィルタリングを使用する。あなたは私に方法を指示できますか？多くのありがとうございます。ありがとうございます。 +名詞extractation | library("openNLP") acq <- "Gulf Applied Technologies Inc

0熱

1答えて

フリーワードで新しい単語を認識する

私はスペイン語のテキストを分析するためにフリーライを使用していますが、使用する辞書をカスタマイズするには疑問があります。 more morar VMM03S0 1 - los lo PP3MPA0 1 - 私はから物事のさまざまな試みた：具体的な例としては、単語モレロスは単数男性的な名詞であるが、2つの単語に分割され、次のように分類されていることです morelos morelos NP

0熱

1答えて

Weka POSタギング+トークン化

私はWekaを初めて利用しています。私は感傷的な映画のレビューを分類しようとしています。つまり、単語の出現をトークン化して属性付けするStringToWord Vectorを理解できます。パーツオブパーツタグを属性ボキャブラリにも追加したいのですが、どのように悩んでいますか？誰もこれを前に試しましたか？教えてください。 P.S。私はPOSタグ付けのためにOpenNLPを使用しており、Weka

1熱

1答えて

POS-TaggerのHMMモデルの精度を調べる

のViterbi Algorithmを、Brown-corpusをデータセットとして使用して実装しています。このNLPタスクの重要な側面は、モデルの精度を見つけることです。だから私は実際に何を実現するかの助けが必要です。 nltk toolkitを使用する方が簡単ですが、私はツールキットを使用していないので、私のモデルの精度を判断する方法について固執しています。どんなヘルプ、コード例、紹介リンクも