2017-02-27 5 views
-2

あなたは私が適切な形式でそれを得ることができるように、私はR/Pythonでこのファイルを読むことができるか、それは多くのヘッダの層から成って見ることができるように、私は以下に指定され、このファイル、データ処理のためにR/Pythonで複数のヘッダを持つ.xlsファイルを読むには?

.Xls file with multiple header

を持っていますそれを処理するために?

+0

「適切」とは何か? – Batman

+0

各列には2つ以上のヘッダーがあります。どのように管理すれば適切なヘッダーデータセットを持つのでしょうか。 –

答えて

0

パンダで読むときに列名を手動で指定することができます。 mutliレベルの列を設定するには

import pandas as pd 

file_name = r"/foo/bar/data.xlsx" 
columns = ["Foo", "Bar", "Baz"] 

df = pd.read_excel(file_name, header=None, skiprows=7, names=columns) 

:あなたは、階層インデックス(マルチインデックス)を見ることができパンダで

df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]}) 
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")] 
df.columns = pd.MultiIndex.from_tuples(columns) 
+0

さて、データセットの各列は複数のヘッダーに基づいて異なるカテゴリに分類されるため、階層を保持するにはどうすればよいですか。たとえば「秋」の列は「稲」のヘッダーの下にあり、「穀物とミレーレ」の下に表示されます。 –

+0

これは私があなたが正当と考えるものを尋ねた理由です。編集された答えを参照してください。 – Batman

+0

さようなら!私はこのタイプのファイルを最初に処理しているので、ちょっと混乱しています。でも、これが正しいフォーマットであるかどうかわかりません。あなたの提案に感謝します。私はこれで試してみます。 –

関連する問題