nltk-trainer

    0

    1答えて

    名前付きエンティティ認識/分類を実行し、IOBタグ付き形式で出力を生成する必要があります。 私はNLTK-train libraryによって配信されるNLTKチャンクを使用していますが、IOBタグのリストではなくツリーを生成します。 def chunk_iob(list_of_words): nltk_tagger = nltk.data.load("taggers/conll2002_

    0

    1答えて

    私はPythonには新しいです。私はテキストから仕事のタイトルを抽出する必要があり、名前エンティティの認識とデータの訓練のためのデータの訓練方法を知る必要があります

    2

    2答えて

    私は木を持っている: (S (WH-QUERY Which) (FLIGHT-NP (FLIGHT-CNP (FLIGHT-CNP (FLIGHT-N flight)) (FLIGHT-DEST to (CITY-NP (CITY-NAME Hue) (CITY-N city))))) (FLIGHT-VP (FLI

    2

    2答えて

    データセット:不動産/土地機能の教師なし分類を含む df['bigram'] = df['Clean_Data'].apply(lambda row: list(ngrams(word_tokenize(row), 2))) df[:,0:1] Id bigram 1952043 [(Swimming,Pool),(Pool,in),(in,the),(the,roof),(roof,t

    0

    1答えて

    私はnltkライブラリで新しく、分類器に自分のコーパスを使っていくつかのラベルを教えようとしています。 How O do B-MYTag you I-MYTag know O , O where B-MYTag to O park O ? O (PSこれでのみ構成されたサンプル...) 私はこれを行う self.classifier = nltk.MaxentClassifie

    0

    1答えて

    私はつぶやきのクラシファイアをトレーニングしようとしています。しかし、問題は、分類子が100%の精度を持ち、最も有益な特徴のリストには何も表示されないということです。誰かが私が間違っていることを知っていますか?私はクラシファイアへの私のすべての入力が正しいと思うので、どこが間違っているのか分かりません。 FEATURE_SET = [(find_features(all_words: import

    0

    1答えて

    わかりましたので、私は、私は(私はコピーしてテキストファイルに貼り付けるウェブサイトから)否定的なレビューに対してそれを実行したときにしかし私は... NaiveBayes映画レビュー分類子を訓練し私は何か間違っているのですか?ここでは以下のコードです: import nltk, random from nltk.corpus import movie_reviews documents =

    0

    1答えて

    最近、NLTKを使用したデータ抽出を検討し始めました。 "実際の"名前、場所などを検出するためのいくつかの例とテクニックがありますが、私は "作られた"または "想像上の"名前を検出する効率的な方法を見いだせませんでした。例えば、文字列は次のようになります。 彼の名前はwuzzywuggであり、彼は私が「wuzzywugg」と「fizzbuzzは」名前であることを検出することができるようにNLTK