たとえば、1日のデータを1日のデータに索引付けすると(たとえば、16:00の日々の価格の索引)、ある日の16:00タイムスタンプの1分のデータがない場合、最後のnullでない1分のデータからのフィルを転送したい。以下の場合、13分の16時前の1分のデータはなく、最後の1分のデータは10分のデータである。インデックスを再作成するときの塗りつぶし方法の機能は何ですか?
reindexをmethod = 'ffill'で使用すると、次のコードが16時に13の値を埋めるとは思いませんか?毎日の検査ではそれが欠落していることがわかります。 1(または、むしろI)として記入する
import pandas as pd
import numpy as np
hf_index = pd.date_range(start='2013-05-09 9:00', end='2013-05-13 23:59', freq='1min')
hf_prices = np.random.rand(len(hf_index))
hf = pd.DataFrame(hf_prices, index=hf_index)
hf.ix['2013-05-10 18:00':'2013-05-13 18:00',:]=np.nan
hf.plot()
ind_daily = pd.date_range(start='2013-05-09 16:00', end='2013-05-13 16:00', freq='B')
print(ind_daily.values)
daily1 = hf.reindex(index=ind_daily, method='ffill')
が期待する、私はこれを実行する必要があります。
daily2 = daily1.fillna(method='ffill')
このような場合は、REINDEX内の充填方法は、実際に何をやっています。パンダのドキュメンテーションから私には分かりません。私は上記の行をする必要はないはずです。
Hmm。私は予期しない動作であり、バグかもしれないことに同意します。その間にあなたを助けてくれるものとして、datetime-indexedデータでは、[resample](http://pandas.pydata。org/pandas-docs/dev/generated/pandas.DataFrame.resample.html)は通常、再インデックスよりも良い選択です。特に、あなたの問題に関連する可能性のあるキーワード引数 '' label''と '' close''を見てください。 –
@ user915そうしないと、欠落値を欠損値として扱いながら、データフレームを他の頻度に再インデックスすることができますか? –
@ method = Noneを使用してランニングしますか? – user915