私は以下のようにnltk字形解析ツールを使用しています。 from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
mystring = "the sand rock needed to be mixed and shaked well before using it for construction wo
インド政府の調査サイトからダウンロードしたパンジャブ語のコーパスについてNLTKに分析を依頼しようとすると、そのスクリプトはGurmikhiです。私の主な目標は、コーパス全体で単語の頻度分布を得ることです。だから、ここでの目的はすべての単語をトークン化することです。 私の問題は、NLTKは、私はPythonのメソッドに建てを使用するときため、テキストを読んでいるかであるように思わ: with op
spacyの文分割/トークナイザが正しく動作しないのはなぜですか? nltkは正常に動作するようです。ここに私の小さな経験があります: import spacy
nlp = spacy.load('fr')
import nltk
text_fr = u"Je suis parti a la boulangerie. J'ai achete trois croissants. C'etai
nltk.orgの第7章で取り組んでみました。特に、ここではhttp://www.nltk.org/book/ch07.htmlのセクション3.2にはConsecutiveNPChunkerクラスがあります。私はコードを複製しようとしました。しかし、それは一貫して次を投げたValueError。次のように 私のコードは次のとおりです。 import nltk
from nltk.corpus i