私のデータセットは、それぞれが関連するメタデータを持つシリーズデータのインスタンスの形式です。各CDトラックがメタデータ(アーティスト、アルバム、長さなど)と一連のオーディオデータを持つCDコレクションと同様です。または、道路状況調査データセットを想像してください - 調査が行われるたびに、道路の単位長さごとの道路状況の物理的なシリーズデータと同様に、場所、日付、時間、オペレータなどのメタデータが記録されます。調査の収集({メタデータ、データ}のペア)がデータセットです。パンダを使用して関連するメタデータを持つシリーズデータのデータベースを格納
pandasを利用して、そのデータセットのインポート、保存、検索、分析を支援したいと考えています。 pandasには、このタイプのデータセットの組み込みサポートがありませんが、多くは追加しようとしています。
はパンダのデータフレームにmetadataを追加しますが、これは周りに間違った方法である - 私は、メタデータのコレクションは、関連するデータ、関連するメタデータでないデータをそれぞれ記録したい:
典型的なソリューションがどちらかです。
Casting data DataFrameの有効なフィールドであり、メタデータフィールドの1つとして格納するが、キャストプロセスは重大な整合性を捨てる。
multiple indicesを使用して3Dデータフレームを作成しますが、これにより、インデックスの選択に関する設計上の詳細が課せられ、実験が制限されます。
この種のデータセットは非常に一般的なものであり、多くの人がそれに対応するためにパンダを曲げようとしています。私は、正しいアプローチが何であるか、あるいはパンダが正しいツールであるとしても、それが何であるか疑問に思います。