私はもともとcsvファイルであったパンダ配列を持っています。私は、列のすべての行から特定の単語を削除したいと思います。ここでは、テキスト

はパンダの配列です：私はもともとcsvファイルであったパンダ配列を持っています。私は、列のすべての行から特定の単語を削除したいと思います。ここでは、テキスト

id   text          spam 
4016  Subject: re : vacation vince : i just found ... 0 
4017  Subject: re : receipts from visit jim , than... 0 
4018  Subject: re : enron case study update wow ! a...0 
4019  Subject: re : interest david , please , call... 0 
4020  Subject: news : aurora 5 . 2 update aurora ve...0

私はすべての列「テキスト」の言葉「件名」を削除したいです行がなるように：

id   text          spam 
4016  re : vacation vince : i just found ... 0 
4017  re : receipts from visit jim , than... 0 
4018  re : enron case study update wow ! a...0 
4019  re : interest david , please , call... 0 
4020  news : aurora 5 . 2 update aurora ve...0

出典

2017-11-25 toumperlekis

私はあなたがreplace必要だと思う - ^は、各文字列の先頭と\s+一つ以上の空白を意味します：

df['text'] = df['text'].replace('^Subject:\s+', '', regex=True) 
print (df) 
    id          text spam 
0 4016 re : vacation vince : i just found ...  0 
1 4017 re : receipts from visit jim , than...  0 
2 4018 re : enron case study update wow ! a...  0 
3 4019 re : interest david , please , call...  0 
4 4020 news : aurora 5 . 2 update aurora ve...  0

しかし whitespace Sを含む第一 9文字削除が必要な場合：

df['text'] = df['text'].str[9:]

を

出典

2017-11-25 12:11:44 jezrael

は、これを試してください

df.text = df.text.apply(lambda row: row[9:])

各行、列「text」の最初の9つの文字に変更され、「件名：」removありますed。

出典

2017-11-25 12:06:02 tschaefermedia

私はもともとcsvファイルであったパンダ配列を持っています。私は、列のすべての行から特定の単語を削除したいと思います。ここでは、テキスト

答えて

関連する問題