1
私は100以上の列と50万行のデータセットを持っています。列Z
の場合、一部の値が欠落しています。私は最初に2列(A,B)
のデータをグループ化し、各グループについて中央値を取得します(それらの数値をスキップします)。次に対応するグループの中央値でZ
にナンを入力します。パンダは与えられたグループの中央値で欠損値を記入します
私は
df.groupby(["A","B"]).Z.median()
でしたが、それはまた、グループの一部ではNaNを持っていると私は本当にグループの中央値でZ
でこれらのNaNを埋めるために続行するかどうかはわかりませんよ...