誰かが次のように進める方法についていくつかの指針を与えることができるのだろうかと思います。パンダスの初心者である私は、私が全体的な知識とスキルのレベルでは、以下で概説する要求を処理するのに十分ではないと感じています。行を挿入して不足しているデータを追加する
私は2,000以上の部品番号のリストを持つpandasデータフレームを持っています。各部品には、部品の販売年数、月数、販売数量、販売価格があります。毎年、不足する月が時々ある可能性があります。以下の2007年のデータ例では、その月に売上がないため、11月が欠落しています。同様に、2008年には、月数11 & 12が欠落しています。私がしたいのは、毎年欠落している月を挿入し、適切な年、月、および各part_idグループ内の数量と売り上げのゼロ値を含む行を挿入することです。
合計でデータは約です。 60200、およその行2000部のIDです。 私は解決策を開発するのに時間を費やしていませんが、私の教育を助けるためのいくつかの指針を使うことができます。
stack
で
from_product
から作成
MultiIndex
による最初の
set_index
、そして
unstack
と
reindex
列が必要だと思う
index Part_ID Year Month Qty Sales
60182 ZZSSL 2007 5 11.0 724.85
60183 ZZSSL 2007 6 7.0 537.94
60184 ZZSSL 2007 7 17.0 1165.02
60185 ZZSSL 2007 8 3.0 159.56
60186 ZZSSL 2007 9 67.0 4331.28
60187 ZZSSL 2007 10 72.0 4582.98
60188 ZZSSL 2007 12 42.0 2651.42
60189 ZZSSL 2008 1 22.0 1422.32
60190 ZZSSL 2008 2 16.0 1178.98
60191 ZZSSL 2008 3 20.0 1276.60
60192 ZZSSL 2008 4 28.0 2120.84
60193 ZZSSL 2008 5 2.0 83.03
60194 ZZSSL 2008 6 16.0 1250.24
60195 ZZSSL 2008 9 17.0 1323.34
60196 ZZSSL 2008 10 2.0 197.98
60197 ZZSSL 2009 1 21.0 1719.30
60198 ZZSSL 2009 2 1.0 78.15
60199 ZZSSL 2009 3 3.0 281.34
60200 ZZSSL 2009 4 25.0 2214.25
60201 ZZSSL 2009 5 10.0 833.60
60202 ZZSSL 2009 6 1.0 83.36
60203 ZZSSL 2009 7 1.0 83.36
こんにちはjezrael、あなたの答えをありがとうございました。毎月毎月1回しか出てこないようにしたいと思います。スタックとアンスタックを研究します。 – carlmorter
まだ月がありません。 11 – carlmorter
あなたは正しいです、私は答えを編集します。 – jezrael