2017-08-21 8 views
1

ファイルヘッダーがいっぱいでない場合、つまり一部の列のみが名前を持ち、その他が空の場合にpandas.read_csvを使用してcsvファイルを読み取ろうとしています。
.ilocを使用してデータフレームを読み取るとき、ヘッダーに名前がない列のみが取得されます。 一部の列に名前がないのは、列のサイズが可変で、各列に名前を割り当てなかったためです。pandas.read_csvを使用して部分ヘッダーCSVを読み取る際の問題

A B C   
3 5 0  1 2 3 

3 5 4  5 6 7 

3 5 8  9 10 11 

3 5 12  13 14 15 

データセット出力::私は、データフレームを使用して取得するにはどうすればよい

dataset = [[1,2,3][5,6,7][9,10,11][13,14,15]] 

ここ

は、コード、入力ファイルと出力の例

dataframe = pandas.read_csv('filename.csv',\ 
          sep = ",",\ 
          header = 0) 
dataframe = dataframe.iloc[::] 
dataset = dataframe.values[:,0:] 

入力ファイルです配列全体(ヘッダなし)?

答えて

0

numpy ndarrayを取り戻すには.valuesが必要だと思います。

from io import StringIO 

csv_file = StringIO("""A B C 
3 5 0 1 2 3 
3 5 4 5 6 7 
3 5 8 9 10 11 
3 5 12 13 14 15""") 

df = pd.read_csv(csv_file,sep='\s',engine='python') 
df.values 

出力:CSVファイルを読み込む際に

array([[ 1, 2, 3], 
     [ 5, 6, 7], 
     [ 9, 10, 11], 
     [13, 14, 15]]) 
0

なぜは= 1をスキップしていませんか?

+0

ありがとう、それは仕事をした、小さなコメントは、私の改訂でexcatパラメータはskiprows = 1 – Amir

+0

@エイリアンoppsです!申し訳ありません、私の悪い –

関連する問題