nltk-trainer

0熱

1答えて

名前付きエンティティ認識/分類を実行し、IOBタグ付き形式で出力を生成する必要があります。私はNLTK-train libraryによって配信されるNLTKチャンクを使用していますが、IOBタグのリストではなくツリーを生成します。 def chunk_iob(list_of_words): nltk_tagger = nltk.data.load("taggers/conll2002_

0熱

1答えて

名前エンティティの認識のためのNLTKでの新しいラベルの訓練方法

私はPythonには新しいです。私はテキストから仕事のタイトルを抽出する必要があり、名前エンティティの認識とデータの訓練のためのデータの訓練方法を知る必要があります

2熱

2答えて

nltk pythonのラベルでツリー内のノードを取得する方法は？

私は木を持っている： (S (WH-QUERY Which) (FLIGHT-NP (FLIGHT-CNP (FLIGHT-CNP (FLIGHT-N flight)) (FLIGHT-DEST to (CITY-NP (CITY-NAME Hue) (CITY-N city))))) (FLIGHT-VP (FLI

2熱

2答えて

検索

データセット：不動産/土地機能の教師なし分類を含む df['bigram'] = df['Clean_Data'].apply(lambda row: list(ngrams(word_tokenize(row), 2))) df[:,0:1] Id bigram 1952043 [(Swimming,Pool),(Pool,in),(in,the),(the,roof),(roof,t

0熱

1答えて

NLTKネガティブケースのMaxentClassifier列

私はnltkライブラリで新しく、分類器に自分のコーパスを使っていくつかのラベルを教えようとしています。 How O do B-MYTag you I-MYTag know O , O where B-MYTag to O park O ? O （PSこれでのみ構成されたサンプル...）私はこれを行う self.classifier = nltk.MaxentClassifie

0熱

1答えて

NLTK Naive Bayesクラシファイアトレーニングの問題

私はつぶやきのクラシファイアをトレーニングしようとしています。しかし、問題は、分類子が100％の精度を持ち、最も有益な特徴のリストには何も表示されないということです。誰かが私が間違っていることを知っていますか？私はクラシファイアへの私のすべての入力が正しいと思うので、どこが間違っているのか分かりません。 FEATURE_SET = [（find_features（all_words： import

0熱

1答えて

否定的なレビューに「POS」のテストを取得

わかりましたので、私は、私は（私はコピーしてテキストファイルに貼り付けるウェブサイトから）否定的なレビューに対してそれを実行したときにしかし私は... NaiveBayes映画レビュー分類子を訓練し私は何か間違っているのですか？ここでは以下のコードです： import nltk, random from nltk.corpus import movie_reviews documents =

0熱

1答えて

NLTKを訓練して、文章中の「構成された」名前を検出することは可能ですか？

最近、NLTKを使用したデータ抽出を検討し始めました。 "実際の"名前、場所などを検出するためのいくつかの例とテクニックがありますが、私は "作られた"または "想像上の"名前を検出する効率的な方法を見いだせませんでした。例えば、文字列は次のようになります。彼の名前はwuzzywuggであり、彼は私が「wuzzywugg」と「fizzbuzzは」名前であることを検出することができるようにNLTK