2016-03-23 29 views
0

私はこの配列の各要素がcsvファイルの行(カンマ区切り)である文字列配列を持っています。私はこれをpandas Dataframeに変換したいと思っています。しかし、行ごとに試してみると非常に遅いです.pandas.read_csv()に続いてwritelines()から離れてもっと速い選択肢を提案できますか?パンダで文字列配列からPandasデータフレームへの高速変換

+1

ポスト例コードおよびデータ – EdChum

+0

'pd.read_csv( 'yourfile.csv')':引数としてファイル名を持つ

使用read_csv。 csvファイルの内容を(配列ではなく)リストに入れてそれを繰り返し処理する必要はありません。 –

答えて

0

CSVインポート

あなたは行をループすることなく、一度に全体csvを読むことができます。

import pandas as pd 
from cStringIO import StringIO 

# Set up fake csv data as test for example only 
fake_csv = ''' 
Col_0,Col_1,Col_2,Col_3 
0,0.5,A,123 
1,0.2,J,234 
2,1.4,F,345 
3,0.7,E,456 
4,0.4,G,576 
5,0.8,T,678 
6,1.6,A,789 
''' 

# Read in whole csv to DataFrame at once 
# StringIO is for example only 
# Normally you would load your file with 
# df = pd.read_csv('/path/to/your/file.csv') 
df = pd.read_csv(StringIO(fake_csv)) 

print 'DataFrame from CSV:' 
print df 

DataFrame from CSV: 
    Col_0 Col_1 Col_2 Col_3 
0  0 0.5  A 123 
1  1 0.2  J 234 
2  2 1.4  F 345 
3  3 0.7  E 456 
4  4 0.4  G 576 
5  5 0.8  T 678 
6  6 1.6  A 789 
+0

ありがとうございました! Uは今日を救った –

+0

@SiddharthMuthukumar 私は助けることができてうれしい! [受け入れることを忘れないでください、あなたは+2評判を得る!](http://meta.stackexchange.com/a/5235/292533) – tmthydvnprt

関連する問題