timeseriesクラスタリングタスクを実行します。 4つのデータ(t1〜t4)があるとします。ここで動的タイムワーピングと正規化
t1={1,1,1,1,1,1,1}
t2={10,10,10,10,10,10,10}
t3={100,100,100,100,100,100,100}
t4 = {1,5,9,13,17,21,25}
、この例の背後に私の意図は、その形状が一定ラインであるので、私は、一緒にグループT1、T2、T3にしたいということです。しかし、t4は昇順のように見えますので、他のグループにいるはずです。
しかし、私はt1とDTW(のpython mlpyパッケージ)を使用して、他の人の間の距離を計算する場合は、次のように私はなりました:
t1-t1: 0 (absolutely)
t1-t2: 63
t1-t3: 693
t1-t4: 84
私たちが見ることができるように、T1〜T3間の距離がよりはるかに大きいですそれはt1〜t4の間です。 これは、t3の振幅のスケールが他のものよりずっと大きいためです。
この状況では、DTWを適合させる前に、各timeseriesデータに対してmin-max正規化(つまり、0〜1正規化)を使用するのがよいでしょうか? つまり、t1、t2、t3を{0,0,0,0,0,0,0}とし、t4を{0,017、...、1}とする。 その後、DTWは結果を返します。
まもなく、私はDTWの前に正規化タスクの適性を疑問に思います。 私はDTWの初心者ですが、基本的な質問であなたを気にして申し訳ありません! :)
は良い材料のために、ありがとうございます。正規化方法をmin-max正規化からZ正規化に変更します。 –