1
現在、私はexcelファイルからテキストを読み込み、bigramを適用しています。 finalListは、以下のサンプルコードで使用されているリストを持っていますの入力ワードから読み取られたリストは入力エクセルファイルです。私は、エンドツーエンドを完了:言葉ngramを適用する前に入力テキストを理解する最善の方法
bigram=ngrams(finalList ,2)
入力テキストの入力テキストのリストに適用さ
from nltk.corpus import stopwords
バイグラムロジック:ライブラリーを、以下の助けを借りて、入力からストップワードを削除し
プロセス。
電流出力:終了、終了、終了プロセスが完了しました。
希望出力:エンドツーエンドのエンドツーエンドプロセスを完了しました。
つまり、(エンドツーエンド)のような単語のグループは1ワードとみなす必要があります。
トークンを確認しますか? – alexis
適切なトークナイザを使用してください:http://nlp.cogcomp.org/ – Daniel