2016-08-05 11 views
0

ヘッダなしのcsvファイルにデータがあります。私はいくつかの列を解析する必要があります。パンダ:csvの列を解析します。

データの一部:私は2列目と3列目をロードする必要が

-1.0,-0.0246259814315,1174.60023796 
1.0,-0.978057706084,1083.19880269 
-1.0,0.314271994507,-1472.97760911 
-1.0,0.179751565771,231.017267343 
1.0,-1.26254374278,-778.271726463 
-1.0,0.249969939456,-52.8014826538 
1.0,-1.87039747875,-324.235348241 

。私はtrain_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[2, 3])を使用するが、それはIndexError: list index out of range

+1

角括弧を囲む必要があります: 'traまた、列の名前または順序の位置のリストを渡す必要があります。 – EdChum

+1

'parse_dates = [1]'を使用して、keep_dates = [1] 'を使用して、in_X = pd.read_csv(" perception-train.csv "、parse_dates = [1]列インデックスはゼロベースであることに注意してください。 – albert

+0

@EdChum 2つの列をscecifyしたい場合は、2つのブラケットを使用する必要がありますか? – ldevyataykina

答えて

1

IIUCインデックスはゼロベースのあなたが必要とするようですが返されます。

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[1, 2]) 

これはまた、あなたの日付COLを変更する必要があることを意味場合にもわからない。:

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[0], usecols=[1, 2]) 

しかし、データを見ると、第1列または第2列を日時計として解釈する方法がわかりません。