私はフットプレッシャーの分析に取り組んでいます。各プレゼンテーションは52x44のマトリックスで、フルキャプチャーはこれらの2D読み取りの時系列です。パンダを使用して2Dデータ系列を表現する - どの構造を使用するのですか?
これは、サンプリングレートとキャプチャ時間に応じてNの形状のナンシーアレイ(52x44xN)で簡単に表現できます。 Numpyを使うと、私が必要とするすべての操作(主にスライシングと簡単な記述統計)を実行できます。
私はPandasの機能を調べることに興味がありますが、どのような列名と構造が適しているのだろうかと思います。
Numpy 3D配列では、インデックスI、J、Nがあります.Pandas DataFrameのインデックスとしてNを使用すると、データ列としてどのように使用できますか?実際には(3 x(52 * 44 * N))の形の行列を使用して、明示的(冗長な)インデックス値を作成するので、私は奇妙なI、J、V
ここで列の値として配列を配置すると、3Dスライス(「ボックス」選択)が問題になるでしょうか?
(EDIT)私はMultiIndexについて何かを見てきましたが、私はそれをどのように使用するか分かりません。
あなたはどう思いますか?
私にはありませんその中には経験がありますが、[xarray](http://xarray.pydata.org/en/stable/)は、このタイプのもののために人気があり、よくサポートされているPythonライブラリです。 –
例を追加することができます。「配列を列の値として配置すると、3Dスライス(「ボックス」選択)に問題がありますか?」あなたは何を達成しようとしているのですか?それはなぜ機能しませんか? また、おそらく、3次元データのための 'pandas.Panel'と考えることができます。私は 'DataFrame'を使っていましたが、それがあなたの問題を解決するかどうかは分かりません。 – user2570465
@ user2570465この状況に関するPanelのドキュメントを読んだところ、うまくいくように見えます。しかし、実際には、データが同種(単一のデータ型)であり、別々の列が単純な索引付け以外のセマンティクスを持たないため、Pandasはこの特定の使用例のためにNumpyに利点を追加していないようです。 – heltonbiker