は、私は失われたデータをたくさん持っているデータフレーム持っていると言うことができます最も完全な行を保つ私は新しいデータフレームを作成したいパンダは
id q1 q2 q3
0 a 1.0 low NaN
1 a 1.0 NaN 1.0
2 b NaN NaN NaN
3 b NaN high 1.0
4 b 0.0 low 0.0
5 c NaN high 0.0
6 d 1.0 high 1.0
7 e NaN NaN 0.0
8 e 1.0 NaN NaN
9 e 0.0 low NaN
をその各id
から1行しか含まれていませんが、その行は最も完全です(NaNの最小インスタンス)。しかし、同じように完了した場合は、現在のソート順で最初のオカレンスを返します。
Ideアル出力は、新たなデータフレームです:
id q1 q2 q3
0 a 1.0 low NaN
1 b 0.0 low 0.0
2 c NaN high 0.0
3 d 1.0 high 1.0
4 e 0.0 low NaN
特に場合があり、私はdf.isnull().sum(axis=1)
を使用して各行のNAの数を数えることができますが、私は、最小合計で行を選択し、その後にそれを使用するかどうかはわかりませんid
ah interesting。 2つの行に同じ 'count'がある場合、どの行を保持するかはどのように選択されますか? – Simon
@Simon sort_valuesが期待どおりに実行されると仮定すると、最初の項目になります。 –