データ処理のためにR/Pythonで複数のヘッダを持つ.xlsファイルを読むには？

-2

あなたは私が適切な形式でそれを得ることができるように、私はR/Pythonでこのファイルを読むことができるか、それは多くのヘッダの層から成って見ることができるように、私は以下に指定され、このファイル、データ処理のためにR/Pythonで複数のヘッダを持つ.xlsファイルを読むには？

.Xls file with multiple header

を持っていますそれを処理するために？

出典

2017-02-27 Nitesh Dm

「適切」とは何か？ – Batman

各列には2つ以上のヘッダーがあります。どのように管理すれば適切なヘッダーデータセットを持つのでしょうか。 –

パンダで読むときに列名を手動で指定することができます。 mutliレベルの列を設定するには

import pandas as pd 

file_name = r"/foo/bar/data.xlsx" 
columns = ["Foo", "Bar", "Baz"] 

df = pd.read_excel(file_name, header=None, skiprows=7, names=columns)

：あなたは、階層インデックス（マルチインデックス）を見ることができパンダで

df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]}) 
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")] 
df.columns = pd.MultiIndex.from_tuples(columns)

出典

2017-02-27 05:45:05 Batman

さて、データセットの各列は複数のヘッダーに基づいて異なるカテゴリに分類されるため、階層を保持するにはどうすればよいですか。たとえば「秋」の列は「稲」のヘッダーの下にあり、「穀物とミレーレ」の下に表示されます。 –

これは私があなたが正当と考えるものを尋ねた理由です。編集された答えを参照してください。 – Batman

さようなら！私はこのタイプのファイルを最初に処理しているので、ちょっと混乱しています。でも、これが正しいフォーマットであるかどうかわかりません。あなたの提案に感謝します。私はこれで試してみます。 –

http://pandas.pydata.org/pandas-docs/stable/advanced.html

をしかし、あなたの適切な見出しの後には、その後、「バットマン」とやるとあなた自身の列見出しを読み込んで適用することによって上記に述べた。

出典

2017-02-27 06:11:23 nicktids

R？ –

データ処理のためにR/Pythonで複数のヘッダを持つ.xlsファイルを読むには？

答えて

関連する問題