2
こんにちはCSVファイルからカスタムストップワードを削除します。私はほぼすべての関連記事をオンラインで読んだことがある!!私は、Python 2.7 ここは、Pythonは、私はPythonのプログラミングに新しいですし、私はディレクトリ内の複数のファイルからカスタムメイドのストップワードを取り除く手助けが必要
- は、このフォーマットを維持し、ちょうど行からストップワードを削除する: 「8806」
- ;」 [チャド]デモ参加Legisの需要の溶解が国会多くの傷、警察が群衆を分散させるよう。「;」19"
- 『44801』は、 "アメリカの石油会社がイラクの石油食料交換プログラムで再生することを役割は大きい精査の下に来ています。 ";" 19 "
- 私はストップワードと呼ばれるdatファイルにストップワードのリストを持っています。
これは私のコードです:
import io import os import os.path import csv os.chdir('/home/Documents/filesdirectory') stopwords = open('/home/StopWords.dat','r').read().split('\n') for i in os.listdir(os.getcwd()): name= os.path.splitext(i)[0] with open(i,"r") as fin: with open(name,"w") as fout: writer=csv.writer(fout) for w in csv.reader(fin): if w not in stopwords: writer.writerow(w)
それは私にすべてのエラーを与えるが、空のファイルを作成しません。どんな助力も非常に感謝しています。
何期待どおりの出力は見えますか? – georgexsh
ありがとうgeorgexh。出力は、 "8806"; "デモンストレーターチャド国会議員警察の群集"; "" 19 " " 44801 ";"役割アメリカの石油会社イラクの油脂のための調査 ";" 19 " – reza
とストップワードリスト? – georgexsh