part-of-speech

    -1

    1答えて

    私は数日間NLTKのPOSタガーを改良しようとしていましたが、わかりません。現在、デフォルトのタグは本当に不正確で、ほとんどの単語に「NN」とタグ付けされています。タガーをより正確に改善するにはどうすればよいですか?私はすでにタガーを練習してみましたが、うまく動かすことができません。 誰にでも簡単な方法がありますか?どうもありがとう。

    1

    2答えて

    私はStanford Annotators NERを使用しています.LemmaがNERの前提条件であることに気付きました。誰かが説明してください、それはなぜですか?さらに重要なことに、なぜNERを行う前にPOSをやるべきでしょうか?スタンフォードアノテーターの 依存関係は、我々が配布NERモデルを通じて探し

    1

    2答えて

    NLTKを使用して、異なる単語が同音異義語を持つ可能性があることを考慮して、単一文字列の可能な品詞を得る方法はありますか?例えば :レポート - 一種> {名詞、動詞} - > {形容詞、名詞} Iは外の単語を品詞をタグPOS-トークナイザを見つけることができませんでした完全な文脈の文脈。これはNLTKの非常に基本的な要求のように思われるので、なぜ私はそれを見つけるのが大変なのか混乱しています。

    0

    1答えて

    私はシンプルな英語のPOSタグ付けプログラムをC#のみで実装する必要があります。

    0

    1答えて

    私は約20000のテキストファイルのコーパスを持っています。これらのテキストファイルを使用してタガーを訓練したいのですが、これらのテキストファイルを1つのテキストファイルにグループ化する必要がありますタグ付けの精度に影響するかどうかを知る)、またはこれらのテキストファイルをすべてpropsファイルに含めるかどうかを確認します。

    1

    1答えて

    スペイシーは名詞-Phrasesのセットを取得するためのnoun_chunks機能が含まれています。 機能english_noun_chunks(下記添付)word.pos == NOUN def english_noun_chunks(doc): labels = ['nsubj', 'dobj', 'nsubjpass', 'pcomp', 'pobj', 'attr

    0

    1答えて

    私はUD Pipeを使用して、ヒンディー語のデータを訓練しタグ付けしています。 私は完全に正常に動作し、コマンドラインで出力を表示 udpipe --tag model.output HI-UD-test.conllu を使用してタグ付けを実行します。この出力をファイルに書き込むにはどうすればよいですか?

    0

    1答えて

    ストラスブールのCDSの自然言語検索エンジンで作業しています。 (ストラスブールの天文データセンター) 頭字語がNNPとタグ付けされることがあり、時にはNNとタグ付けされることがあるため、スタンフォード品詞タグが頭字語にどのようにタグ付けしていたのか疑問に思っていました。 "CDS"や "NASA"のような頭字語がNNPかNNかどうかについて、プログラムがどのように決定しているかを正確に見つけるこ

    0

    1答えて

    私は、品詞タグ付けからの「タグ付き」結果の使用方法を理解しようとしています。現在、私は、このテストコードしている: 私はそれを実行すると、それはこれで返します。 これは、すべての罰金です。しかし、私はこの結果を使用できるようにしたいと思うし、どのようにするかわからない。 'test'変数に 'VBG'タグが含まれているかどうかを確認するにはどうすればよいですか? 'test'の値をチェックする方法