csv
ファイルを解析する必要があります。csv他の列に対応する列を読み取る値
入力:ファイル+名前
Index | writer | year | words
0 | Philip | 1994 | this is first row
1 | Heinz | 2000 | python is wonderful (new line) second line
2 | Thomas | 1993 | i don't like this
3 | Heinz | 1898 | this is another row
. | . | . | .
. | . | . | .
N | Fritz | 2014 | i hate man united
出力:私が試してみました何
l = ['python is wonderful second line', 'this is another row']
を名に対応するすべての単語のリスト?
import csv
import sys
class artist:
def __init__(self, name, file):
self.file = file
self.name = name
self.list = []
def extractText(self):
with open(self.file, 'rb') as f:
reader = csv.reader(f)
temp = list(reader)
k = len(temp)
for i in range(1, k):
s = temp[i]
if s[1] == self.name:
self.list.append(str(s[3]))
if __name__ == '__main__':
# arguements
inputFile = str(sys.argv[1])
Heinz = artist('Heinz', inputFile)
Heinz.extractText()
print(Heinz.list)
出力は次のとおりです。
["python is wonderful\r\nsecond line", 'this is another row']
は、どのように私は言葉の複数行が含まれているセルの\r\n
を取り除くか、およびループは、その非常に遅いように改善されるだろうか?
私が欲しいものではありません。私は特定の作家/アーティストの言葉が必要です。すべての単語ではありません。 –
@TonyTannous特定の作家の答えを更新しました。 –