私は時系列分類で始まり、トレーニングセットをどのように構築するべきかを理解するのに問題があります。私の現在のデータは、次のようになります。時系列分類のためのデータセットを構築するにはどうすればいいですか?
Timestamp User ID Feature 1 Feature 2 ... Feature N target
2002-10-30 1 0 0 ... 1 0
2002-10-31 2 0 1 ... 1 0
...
...
2017-10-30 1 0 0 ... 0 1
2017-10-31 2 0 1 ... 0 0
機能が与えられたUser ID
のための時間t
で記録されたワンホットエンコードされたテキスト機能、あります。ターゲットは、時刻に発生/発生していないイベントです。t
。新しい予定時刻t
で、データセットのUser IDs
すべての新しい機能があれば、このイベントを検出します。
私はthis paperから、これをモデル化する1つの方法は「スライディングウィンドウクラシファイア」を使用していることを理解しました。
いつでもt
のために、私はから一緒に機能を集約し、「イベントがt, t+1, ... t+n
のいずれかで発生したかではない」ことになる、より柔軟な目標を設定することができます。このような分類子を作成する正しい方法ですか?
私はまた、more recent approachesのように、「リカレントニューラルネットワークアーキテクチャ(LSTM)」と考えています。どのように私は上記のデータセットからこのモデルを供給するためのトレーニングセットを構築することができますか?
ps:私はscikit-learn/Kerasを使って分類器を構築する予定です。
あなたの時間と回答に事前に感謝します。
で処理することができスペクトログラムを構築することができます(ターゲットがあります0または1)。ですから、入力とターゲットの関係を見つけなければなりません。データの他の前処理は必要ありません。あなたはこれに複数のテクニックを使用することができます:ニューラルネットワーク、遺伝的プログラミングなど... –