2016-07-06 20 views
0

DataScienceで再生するデータセットを処理しようとしていますが、列名はありません。以下に示すようにdf.head()の出力:パンダ:データファイルの列名がありません

1 73     Not in universe 0 0.1 0.2 Not in universe.1 
0 2 58 Self-employed-not incorporated 4 34  0 Not in universe 
1 3 18     Not in universe 0 0  0  High school 
2 4 9     Not in universe 0 0  0 Not in universe 
3 5 10     Not in universe 0 0  0 Not in universe 
4 6 48       Private 40 10 1200 Not in universe 

私が見たい何が

0 1 73     Not in universe 0 0.1 0.2 Not in universe.1 
1 2 58 Self-employed-not incorporated 4 34  0 Not in universe 
2 3 18     Not in universe 0 0  0  High school 
3 4 9     Not in universe 0 0  0 Not in universe 
4 5 10     Not in universe 0 0  0 Not in universe 
5 6 48       Private 40 10 1200 Not in universe 

である私は、ランダムな列名を割り当てることができますが、よりよい方法はありますか?

+3

どのようにこのデータをロードしたのですか?あなたのファイルにヘッダー列がないことを伝えていないようですが、例えば 'read_csv'に' header = None'を渡すことができます。また、dfsには常に列名が付きます。 – EdChum

+0

データセットはa認定プロジェクト私はアカデミーに尋ねられ、実際の生活状況を反映するために列名が意図的に削除されたと言われました。私の意見では、実際の生活の状況でさえ、あなたは列の意味を知るでしょう。だから私は列にランダムな名前を割り当てる必要がありますか? –

+0

これは、 'header = None'というパラメータを渡したときに列名として0からn-1まで番号が付けられます。 – EdChum

答えて

3

あなたはその後、header=Noneを渡す欠けている場合、それは、最初の行からそれを推測し、デフォルトでは、それはヘッダー行を持っていたかどうかを指定せずにファイルをロード:

df = pd.read_csv(file_path, header=None) 
関連する問題