4
で欠落している日付の値を入力します。データセットには2940行あります。データセットのスナップショットは下に表示されます。私はデータフレームを使用して株価データを保存するためにパンダを使用しているパンダのデータフレームの列
時系列データは、土曜日と日曜日の値が含まれていません。そのため欠損値を埋める必要があります。ここ
は、私が書いたコードですが、問題を解決されていません。
import pandas as pd
import numpy as np
import os
os.chdir('C:/Users/Admin/Analytics/stock-prices')
data = pd.read_csv('stock-data.csv')
# PriceDate Column - Does not contain Saturday and Sunday stock entries
data['PriceDate'] = pd.to_datetime(data['PriceDate'], format='%m/%d/%Y')
data = data.sort_index(by=['PriceDate'], ascending=[True])
# Starting date is Aug 25 2004
idx = pd.date_range('08-25-2004',periods=2940,freq='D')
data = data.set_index(idx)
data['newdate']=data.index
newdate=data['newdate'].values # Create a time series column
data = pd.merge(newdate, data, on='PriceDate', how='outer')
土曜日と日曜日の欠損値を埋めるためにどのように?
bfill().reset_index()を使用して、次のTypeErrorが表示されます。 Onl DatetimeIndex、TimedeltaIndexまたはPeriodIndexとの有効なYが、 'のRangeIndex' のインスタンス – User456898
あなたが列 'PriceDate'から設定されたインデックス必要だ - ' data.set_index( 'PriceDate'、インプレース= true)を '。 – jezrael
ありがとうございます、今はうまくいきます! – User456898