2016-12-27 10 views
1

Python(2.7.13)でExcelファイルを読み込もうとしています。このために、私は次のエントリで、サンプルファイル、BOOK1を作成 -Pythonで出力として目的のExcelファイルを読み取ることができません

enter image description here

import pandas as pd 
import numpy as np 

Book1 = pd.read_excel("D:\Python\Book1.xlsx") 

print(Book1.head()) 

を上記のプログラムを書き込み、PowerShellでそれを実行した後、私は理解していない次の出力を得ました。

enter image description here

Eセルの値が7歳7.1から変更された最初の列と理由で0,1,2は何ですか?誰かが私にこれを説明することはできますか?プログラムに何か問題がありますか?

アップロードした画像がここで適切でない場合はお詫び申し上げます。私はそのようなデータを入力する他の方法を知らない。

答えて

6

0,1,2は行インデックスです。ヘッダーを渡さなかったため、最初の行は自動的にヘッダーに変換されました。

今、私たちは同じ名前を持つ2つの列を持つことはできません、ので、第二7は、これを修正するには7.1

に変換された、あなたが試すことができます:

no_of_columns = 5 Book1 =pd.read_excel("D:\Python\Book1.xlsx",header=None,name=range(no_of_columns))

注意をこれを行うには手前の列の数を知る必要があります。

4

パンダは、最初の行をヘッダー列として読み取ります。列の名前の競合を避けたいので、最初の7列は元の名前を保持します。 2番目の7は衝突を生成するため、pandasはそれを7.1に変更します。

セットheader=None。パラメータの詳細については、docsを参照してください。

カラムのnamesを次のように指定できます。

0,1,2は、行のインデックスです。これらの数字を使用して行を参照することができます。

>>> Book1[0] 
1 3 7 2 7.1 <- column names 
2 2 3 2 1 <- values in row 0 
関連する問題