pandas DataFrameとネイティブPython dictのmixinクラスを作成して、ネストされたdictのようにデータフレーム列にアクセスできるようにするにはどうすればいいですか? Accessing pandas DataFrame as a nested listから、df.loc()
機能を使用すると、目的の行/列/スライスにアクセスする方法です。pandas DataFrameとネイティブPython用Mixinクラスの作成dict
しかし、目標は、ネイティブのPython dictと同じ構文を使用して2-Dデータフレームにアクセスすることです。例えば。
>>> import pandas as pd
>>> df = pd.DataFrame([['x', 1,2,3,4,5], ['y', 6,7,8,9,10], ['z', 11,12,13,14,15]])
>>> df.columns = ['index', 'a', 'b', 'c', 'd', 'e']
>>> df = df.set_index(['index'])
>>> df
a b c d e
index
x 1 2 3 4 5
y 6 7 8 9 10
z 11 12 13 14 15
>>> df['x']
[1, 2, 3, 4, 5]
>>> df['x']['a']
1
>>> df['x']['a', 'b']
(1, 2)
>>> df['x']['a', 'd', 'c']
(1, 4, 3)
は私のようなミックスインクラスを作成しようとしました:
from pandas import DataFrame
class VegeTable(DataFrame, dict):
def __init__(self, *args, **kwargs):
DataFrame.__init__(self, *args, **kwargs)
def __getitem__(self, row_key, column_key):
if type(row_key) != list:
row_key = [row_key]
if type(column_key) != list:
column_key = [column_key]
return df.loc[row_key, column_key]
をしかし、私は辞書のキーアクセスが機能しなかったように欠けている何かがあると思うとdict.get
は奇妙な値を返します。パンダのデータフレームとデータフレームの列は次のようにアクセスすることができるようなネイティブのPythonの辞書のためのミックスインクラスを作成する方法
>>> from pandas import DataFrame
>>>
>>>
>>> class VegeTable(DataFrame, dict):
... def __init__(self, *args, **kwargs):
... DataFrame.__init__(self, *args, **kwargs)
... def __getitem__(self, row_key, column_key):
... if type(row_key) != list:
... row_key = [row_key]
... if type(column_key) != list:
... column_key = [column_key]
... return df.loc[row_key, column_key]
...
>>>
>>> vt = VegeTable([['x', 1,2,3,4,5], ['y', 6,7,8,9,10], ['z', 11,12,13,14,15]])
>>> vt.columns = ['index', 'a', 'b', 'c', 'd', 'e']
>>> vt = vt.set_index(['index'])
>>> vt
a b c d e
index
x 1 2 3 4 5
y 6 7 8 9 10
z 11 12 13 14 15
>>> vt['x']
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/local/lib/python2.7/site-packages/pandas/core/frame.py", line 2062, in __getitem__
return self._getitem_column(key)
File "/usr/local/lib/python2.7/site-packages/pandas/core/frame.py", line 2069, in _getitem_column
return self._get_item_cache(key)
File "/usr/local/lib/python2.7/site-packages/pandas/core/generic.py", line 1534, in _get_item_cache
values = self._data.get(item)
File "/usr/local/lib/python2.7/site-packages/pandas/core/internals.py", line 3590, in get
loc = self.items.get_loc(item)
File "/usr/local/lib/python2.7/site-packages/pandas/core/indexes/base.py", line 2395, in get_loc
return self._engine.get_loc(self._maybe_cast_indexer(key))
File "pandas/_libs/index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc (pandas/_libs/index.c:5239)
File "pandas/_libs/index.pyx", line 154, in pandas._libs.index.IndexEngine.get_loc (pandas/_libs/index.c:5085)
File "pandas/_libs/hashtable_class_helper.pxi", line 1207, in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas/_libs/hashtable.c:20405)
File "pandas/_libs/hashtable_class_helper.pxi", line 1215, in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas/_libs/hashtable.c:20359)
KeyError: 'x'
>>> vt.get(['x'])
>>> vt.get('x')
>>> vt.get('x', 'a')
'a'
>>> vt.get('x', ['a', 'b'])
['a', 'b']
>>> vt.get('x', ['a', 'b'])
入れ子にされたdict?それはまったく可能ですか?もしそうなら、どうですか?
あなたが行の '__getitem__'を使用した場合、私はまた、ネイティブのPythonネストされた辞書は、この方法で評価することができることを疑いますアクセス、現在の列アクセスの代わりに、どのように列アクセスを提案するのですか? –
'vt [row_ids、column_ids]'と 'vt [row_ids]'行のアクセスに対してネストされたdict 'defaultdict(dict)'がアクセスされる方法と同じです。 – alvas