2017-09-15 1 views
0

私はデータ(3000行と20000列)を持っています。私は 'クラス'のヘッダーを持つ列を追加する必要があり、3000行にはすべて同じ名前の 'Big'が含まれています。私はそれを手動でやろうとしましたが、ファイルが大きすぎて完全に読み込めません。 私はそれが簡単かもしれませんが、私はPythonにいくつかのコードを試してみましたが、それらのうちのどれもが必要な結果を出したことは初めてです。Pythonを使用してcsvファイルの大きなデータセットに列を追加する最も良い方法は何ですか?

答えて

1

使用Pandas module

import pandas as pd 

df = pd.read_csv(r'/path/to/file.csv').assign(Class='Big') 
df.to_csv('/path/to/new_file.csv', index=False) 

または1ライナーとして:

pd.read_csv(r'/path/to/file.csv').assign(Class='Big') \ 
    .to_csv(r'/path/to/new_file.csv', index=False) 

UPDATE:

I have 9 files as the one you just helped me to add a column to, each one represent a class's attributes. can you tell me how i can combine these files in one csv file, that will be 27000 rows and 30000 columns?

files = ['file1.csv','file2.csv', ...] 

df = pd.concat([pd.read_csv(f) for f in files], ignore_index=True) 
+0

そのエラーを与える:DF = PD。 read_csv( 'pdc_big copy (クラス= 'Big') ^ SyntaxError:無効な構文 – sara

+1

@sara、 'class'は予約語なので、代わりに' Class'を試してください – MaxU

+0

私はあなたが今まで私を助けたものとして9つのファイルを持っています列を追加するには、それぞれがクラスの属性を表します。私はこれらのファイルを1つのcsvファイルにどのように組み合わせることができますか、それは27000行と30000列になりますか? – sara

関連する問題