I以下のパンダはDataFrame
持っている:データフレーム
ID COL1 COL2
123 1 ABC
123 1 CCC
123 1 AVV
345 2 FGG
345 2 FRG
345 2 FGT
:
ID COL1 COL2
123 1 ABC
123 1 CCC
123 NaN AVV
345 2 FGG
345 NaN FRG
345 NaN FGT
私はこの結果を得るために同じID
に基づいてCol1
内のすべてのNaN値を代入する必要があります私はfor
ループを書くことができますが、私のデータセットがスクリプトを実行するのに長い時間がかかるでしょう。条件付き置換関数はありますか?
'df.groupby( 'ID').ffill()。bfill()'は何が必要ですか? – Psidom
@Psidom:はい、そうです。ありがとうございました。唯一の問題は、1GBのデータの計算を終了するのに時間がかかることです。 – duckertito
df.sort_values(['ID'、 'COL1']).ffill() 'を試してください。上記の方法よりも。 NaNの値をデータフレームの最後にソートし、 'ffill()'メソッドのみを使用して欠損値を埋めます。 – Psidom