パンダは与えられたグループの中央値で欠損値を記入します

私は100以上の列と50万行のデータセットを持っています。列Zの場合、一部の値が欠落しています。私は最初に2列(A,B)のデータをグループ化し、各グループについて中央値を取得します（それらの数値をスキップします）。次に対応するグループの中央値でZにナンを入力します。パンダは与えられたグループの中央値で欠損値を記入します

私は

df.groupby(["A","B"]).Z.median()

でしたが、それはまた、グループの一部ではNaNを持っていると私は本当にグループの中央値でZでこれらのNaNを埋めるために続行するかどうかはわかりませんよ...

出典

2017-04-11 kim kevin

てみてください：

df.groupby(["A","B"]).Z.apply(lambda x: x.fillna(x.median()))

出典

2017-04-11 03:23:50 Abdou

パンダは与えられたグループの中央値で欠損値を記入します

答えて

関連する問題