4列の行列です。私は最初の2つの列を維持し、最後の2つの列を発生行列の一種にしたい(しかし対応する値で)。私はgroupby ['shop_id'、 'item_id'、 'date']にしようとしましたが、空の日付の0をどのように埋めるのか分かりません。誰でもアイデアはありますか?多くのおかげでパンダ列を使ってオカレンス行列を作る方法
given:
shop_id item_id date sales
0 19 0 1
0 19 2 13
0 19 3 11
1 19 1 3
result:
shop_id item_id date_0 date_1 date_2 date_3
0 19 1 0 13 11
1 19 0 3 0 0
おかげを使用して、私は(範囲(2,6)に私のために10 **(i))を異なるデータサイズのスコット、piSquaredとCOLDSPEEDからの解の集合を比較時間効率の点で大規模なデータセット(1,000,000行以上)で最小時間で実行されるunstack()メソッドが判明し、defaultdict()は小さなデータセット(10,000よりも大きい)で優れています。 pivot_table()の実行は、これらの2つのメソッドの中間にあります。 –