データフレームは、以下のように2つの列「AvailbilityZone」と「InstanceType」でグループ化されています。複数の時系列を相関させるためのPythonの使用
は、私は、これは次のコードを使用して作成します。
#Create full time series and fill data
dfSorted = df.groupby(['AvailabilityZone', 'InstanceType'])
dfSorted = dfSorted.resample('H')
dfSorted = dfSorted.fillna("ffill")
dfSorted = dfSorted.dropna()
ごとにグループ化は時系列を表します。私はすでにすべての時系列が1時間単位で実行されるようにデータを再サンプリングしました。どのように相関関係を実行して、各時系列が互いに似ているかを調べるにはどうすればよいですか?
私が使用:
dfSorted.corr()
それだけだから私は、私はおそらくループのようなものを使用する必要がありますと仮定するつもりですSpotPrice = 1を返しますか?それぞれの時系列を他と比較しますか?私は何か助けを失っている多くの感謝です!ここで
はcsvファイルとしての私のデータフレームです: https://www.dropbox.com/s/xgv8xm5n5o856mx/out.csv?dl=0
I単に使用df.tocsv()
我々はpd.read_clipboard()(またはのスニペットを使用してインポートすることができ、あなたのデータフレームのサンプルを投稿してくださいそれを作成するコード)と、望ましい/期待される出力を示します。 –
@JulienMarrec私はデータフレームへのリンクを編集してダウンロード用のcsvとして追加しました! –
投稿head()出力 – Boud