ないの重複によって、ビン株式取引データ:私はのためのデータをチェックプルするRblpapi
でgetMultipleTicks
を使用していますR - 二、VWAP取引が、塊のボリューム
Binning Dates in R または Binning time data in R
コンテキスト1ヶ月以上の株式(この例ではTSLA):
rawData = getMultipleTicks("tsla us equity", eventType = "TRADE", startTime = as.POSIXlt("2017-03-10 13:30:00"), endTime = as.POSIXlt("2017-04-10 20:00:00"), tz="America/New_York")
> str(rawData)
'data.frame': 1130690 obs. of 3 variables:
$ times: POSIXct, format: "2017-03-10 08:30:07" ...
$ value: num 246 246 246 246 246 ...
$ size : num 58 42 80 5 9 1 4 73 100 941 ...
目的
このデータは、このから変換する必要があります
生データ:これに
> head(rawData, 5)
times value size
1 2017-04-10 09:30:00 309 1
2 2017-04-10 09:30:00 309 1
3 2017-04-10 09:30:02 309 1
4 2017-04-10 09:30:02 308 1
5 2017-04-10 09:30:04 309.38 1
:
のClean Data:
> head (cleanData, 5)
times value size
1 2017-04-10 09:30:00 309 2
2 2017-04-10 09:30:01 0
3 2017-04-10 09:30:02 308.5 2
4 2017-04-10 09:30:03 0
5 2017-04-10 09:30:04 309.38 1
(秒)
- 欠落回
- 価格に充填されている
- ボリューム(サイズが)
計算時間が問題ではありません一緒に加算される(値はVWAPです)。
物事は私が、私は単純に?cut
を使用して試みたが、Binning time data in Rあたりの任意の意味のある結果を得ることができませんでした
を試してみました。
同僚はforループを使用することを推奨しましたが、上記の要件を実装する方法を開始する方法がわかりません。
また、これは正しい、 'ライブラリ(lubridateを)'必要ですか? –
要するに、それは必要でさえありません。 'floor_date'関数を削除するようにコードを更新しました。私は当初VWAPを分単位で望んでいると思っていましたが、これは私の答えにとどまりました。 –
さて、これはプロセスのスピードを速めるはずですが、私は潤滑剤がかなり減速したと信じています –