2017-04-11 2 views
1

私は100以上の列と50万行のデータセットを持っています。列Zの場合、一部の値が欠落しています。私は最初に2列(A,B)のデータをグループ化し、各グループについて中央値を取得します(それらの数値をスキップします)。次に対応するグループの中央値でZにナンを入力します。パンダは与えられたグループの中央値で欠損値を記入します

私は

df.groupby(["A","B"]).Z.median() 

でしたが、それはまた、グループの一部ではNaNを持っていると私は本当にグループの中央値でZでこれらのNaNを埋めるために続行するかどうかはわかりませんよ...

答えて

1

てみてください:

df.groupby(["A","B"]).Z.apply(lambda x: x.fillna(x.median())) 
関連する問題