2017-02-02 14 views
0

に対して削除します。そのため、CSVファイルを読み込み、特定の列を保持してファイルを書き換えています。私が持っている問題は、1つの列(たとえばColumnA)は二重引用符で囲まれた値を持つということです。この仕事を達成し、二重引用符を削除する簡単な方法はありますか?python pandasの二重引用符をすべての列の値

a = pd.read_csv(filename,low_memory=False) 

a1 = a[['ColumnA','ColumnB']] 

a1.to_csv('filelocation') 
+0

DF [ 'ColumnA'] =のDF [ 'ColumnA'] str.replace( '"'、 '')' – EdChum

+1

'を試してください:あなたは新しいCSVファイルがあることパース/読まれる時、将来的に問題を抱えています生データのサンプルを投稿することもできますか?これらの列をロードするつもりであれば、 'read_csv'で指定することができます:' a = pd.read_csv(filename、usecols = ['ColumnA'、 'C​​olumnB']) ' – EdChum

+0

" a1 = ..の前にその行を追加しました。 。 "ステートメントが動作しませんでした... –

答えて

1

あなたはcsv.QUOTE_NONEを使用して引用抑制することができます。

import csv 
pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \ 
    .to_csv(new_file_name, quoting=csv.QUOTE_NONE, index=False) 

が、それは別の区切り文字(ColumnA列に発生していないもの)を選択すること(安全な)方が良いでしょう、あなたがしません。

pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \ 
    .to_csv(new_file_name, sep=';', index=False) 
関連する問題