あなたは私が適切な形式でそれを得ることができるように、私はR/Pythonでこのファイルを読むことができるか、それは多くのヘッダの層から成って見ることができるように、私は以下に指定され、このファイル、データ処理のためにR/Pythonで複数のヘッダを持つ.xlsファイルを読むには?
を持っていますそれを処理するために?
あなたは私が適切な形式でそれを得ることができるように、私はR/Pythonでこのファイルを読むことができるか、それは多くのヘッダの層から成って見ることができるように、私は以下に指定され、このファイル、データ処理のためにR/Pythonで複数のヘッダを持つ.xlsファイルを読むには?
を持っていますそれを処理するために?
パンダで読むときに列名を手動で指定することができます。 mutliレベルの列を設定するには
import pandas as pd
file_name = r"/foo/bar/data.xlsx"
columns = ["Foo", "Bar", "Baz"]
df = pd.read_excel(file_name, header=None, skiprows=7, names=columns)
:あなたは、階層インデックス(マルチインデックス)を見ることができパンダで
df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]})
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")]
df.columns = pd.MultiIndex.from_tuples(columns)
さて、データセットの各列は複数のヘッダーに基づいて異なるカテゴリに分類されるため、階層を保持するにはどうすればよいですか。たとえば「秋」の列は「稲」のヘッダーの下にあり、「穀物とミレーレ」の下に表示されます。 –
これは私があなたが正当と考えるものを尋ねた理由です。編集された答えを参照してください。 – Batman
さようなら!私はこのタイプのファイルを最初に処理しているので、ちょっと混乱しています。でも、これが正しいフォーマットであるかどうかわかりません。あなたの提案に感謝します。私はこれで試してみます。 –
http://pandas.pydata.org/pandas-docs/stable/advanced.html
をしかし、あなたの適切な見出しの後には、その後、「バットマン」とやるとあなた自身の列見出しを読み込んで適用することによって上記に述べた。
R? –
「適切」とは何か? – Batman
各列には2つ以上のヘッダーがあります。どのように管理すれば適切なヘッダーデータセットを持つのでしょうか。 –