2016-04-22 14 views
0

私は3つの異なるセンサーデータで予測をしようとしています。各センサは周期性を有し、測定時点は同じではない(例えば、sensor1data_time = 10:01; sensor2data_timestamp = 10:03; sensor3data_timestamp = 10:05)。RapidMinerタイムスタンプ前処理

私はこの作業をデモ用に手動で行いましたが、今は予測モデルを開発するために自動化する必要があります。

任意の前処理タスクが推奨されますか?

おかげで、事前

答えて

2

に私は最寄りの10分のようなものに時間を丸めるでしょう。使用する演算子はGenerate Attributesです。私は1970年1月1日からの秒数を使用する傾向があります。次のフラグメントは、使用できる機能を示しています。私はdatestrという名前の属性を持っていると仮定しています。この形式の日付は13-01-2016 23:01:01です。

attribute name function expression  
------------------------------------------------------------------- 
date    date_parse_custom(datestr, "dd-MM-yyyy HH:mm:ss") 
epochdate   date_diff(date_parse(0), date)/1000 
dateToTenMins  600*round(epochdate/600) 

エポックの日付はミリ秒単位で、1000で割ると秒が与えられます。

+0

私はあなたが何を意味するかを見ます。ご協力ありがとうございました。しかし、複数の値が同じタイムスタンプに丸められた場合、重複する値を削除するのに 'FilterExamples'演算子を使用できますか? – Havor

+0

'Aggregate'演算子を使用して、同じタイムスタンプを持つサンプルの数を数えることができます。各センサーからのタイムスタンプごとに1が表示されると予想されます。 – awchisholm

+0

本当にあなたの助言を助けました:)ちょうどもう1つの質問。私はなぜあなたが '600'を使っているのか分からない。私は、より低い時間に丸めたいと思った場合に、最も近い5分に丸めする代わりに、どういう意味ですか?たとえば、1:03と1:53の場合は、両方とも1:00を取得したいとしますか?どうすればいい? – Havor