内補間:パンダは、私は、以下の情報を持つデータフレームを持っているGROUPBY
filename val1 val2
t
1 file1.csv 5 10
2 file1.csv NaN NaN
3 file1.csv 15 20
6 file2.csv NaN NaN
7 file2.csv 10 20
8 file2.csv 12 15
私はインデックス、だけ各ファイルグループ内に基づいてデータフレームの値を補間したいと思います。補間する
、私は通常、
df = df.interpolate(method="index")
をするでしょうし、そのグループに、私は
grouped = df.groupby("filename")
を行い、私はこのように補間データフレームをしたいと思います:
filename val1 val2
t
1 file1.csv 5 10
2 file1.csv 10 15
3 file1.csv 15 20
6 file2.csv NaN NaN
7 file2.csv 10 20
8 file2.csv 12 15
NaNは、file2グループの最初の項目であるため、t = 6にまだ存在しています。
私は、「適用」を使用する必要が疑われるが、任意の助けをいただければ幸いです正確にどのよう...
grouped.apply(interp1d)
...
TypeError: __init__() takes at least 3 arguments (2 given)
把握することができていません。
これは小さなデータフレームで動作するようですが、大規模なものでは* long *時間がかかります(.interpolate()を使用した場合よりも長い時間がかかります)。効率がそれほど悪くなると思いますか?グループの数は、行の数の数(10^7行に比べて約1000のグループ)に比べて小さいです。 –