1
私は2列の文を含むCSVファイルを持っています。たとえば のためのtest.CSV:どのようにcsvファイルの各行を停止するには?
Col[1]
----------------------
This trip was amazing.
Col[2]
--------------------
The cats are playing.
ので、私はいくつかのNLPのプロセスをした:
with codecs.open('test.csv','r', encoding='utf-8', errors='ignore') as myfile:
data = csv.reader(myfile, delimiter=',')
next(data)
stops = set(stopwords.words("english"))
stemmer = PorterStemmer()
for row in data:
word_tokens1 = word_tokenize(row[1].lower())
word_tokens2 = word_tokenize(row[2].lower())
remo1 = [w for w in word_tokens1 if w in re.sub("[^a-zA-Z]"," ",w)]
remo2 = [w for w in word_tokens2 if w in re.sub("[^a-zA-Z]"," ",w)]
list1 = [w for w in remo1 if not w in stops]
list2 = [w for w in remo2 if not w in stops]
for w in list1:
l = stemmer.stem(w)
print(l)
for w in list2:
l2 = stemmer.stem(w)
print(l2)
私は語幹ないとき私の問題であり、私はそれを印刷するとき:
trip
amazi
cat
play
それは各単語を一列に印刷します。どのように私は のような語幹の後の文に戻ることができます:
Col[1]:
-------------------
trip amazi
Col[2]:
-------------------
cat play
ファイルのサンプルを表示できますか?私はなぜあなたがcsvパッケージを使用しているのだろうかと思います。私が見る限り、あなたは行を気にします。 csvでは、列はコンマで区切られます。行は改行で区切られています。 – MAZDAK
それは違う色です。申し訳ありませんが、私はコードとして書いています。 –
"この旅行はすごいよ、猫は遊んでいる"のように見えるのですか? – MAZDAK