私は次のようなデータセットを持っています。私は残りの部分を補間しようとしている月の最終日のデータしか持っていません、それを行う正しい方法ですか?補間のためにPython pandasデータフレームが欠損データを補間する
Date Australia China
2011-01-01 NaN NaN
2011-01-02 NaN NaN
- - -
- - -
2011-01-31 4.75 5.81
2011-02-01 NaN NaN
2011-02-02 NaN NaN
- - -
- - -
2011-02-28 4.75 5.81
2011-03-01 NaN NaN
2011-03-02 NaN NaN
- - -
- - -
2011-03-31 4.75 6.06
2011-04-01 NaN NaN
2011-04-02 NaN NaN
- - -
- - -
2011-04-30 4.75 6.06
私は次のコード
import pandas as pd
df = pd.read_csv("data.csv", index_col="Date")
df.index = pd.DatetimeIndex(df.index)
df.interpolate(method='linear', axis=0).ffill().bfill()
しかし、私はエラーになっています使用してい行方不明NaN値を見つけるために、このデータフレーム「はTypeError:すべてのNaNを補間することはできませんが」
ここで間違っている可能性がありますが、これをどのように修正できますか?
ありがとうございました。
エラーは完全にわかりやすいものです。あなたはこのhttp://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.htmlに基づいてNaNを落とすことで試すことができます – station
こんにちは、助けていただきありがとうございます.NaNの代わりに何を記入してくださいそれらの行? – Unnikrishnan
@Unnikrishnan良い答えはすでに与えられている、と私は思います。あなたのデータは非常に希薄ですので、実際にこのような巨大な量のデータを補間することは良い考えであるかどうか疑問に思うかもしれません。これらの価値がいくらか正しいと確信していますか? –