2016-12-24 10 views
0

私は次元数を減らすためにdft信号に変換したい時系列データセットがあります。 dftに変換した後、k-meansアルゴリズムを使用して結果のdftデータセットをクラスタリングしたいと思います。時系列DFT信号クラスタリング

dftシグナルには虚数が含まれているため、どのようにそれらをクラスタリングできますか?

答えて

0

単純に、虚数部分をベクトルの別の要素として扱うことができます。他のアプリケーションでは、それを無視したいでしょう!

しかし、あなたは他のより厳しい課題に直面します。

データマイニング、特にクラスタリングは、appliyng関数a(dft)と関数b(k-means)と同じくらい簡単であることはほとんどありません。申し訳ありません - それは探索的なデータマイニングの仕組みではありません。

まず、多くの時系列について、DFTは役に立たないでしょう。他の人は、適切なリサンプリングやセグメンテーションを行うか、季節性などの面白い効果を取り除く必要があります。 DFTが機能しても、サンプリング周波数や干渉などのアーティファクトを強調することがあります。

そして、あなたは一つの重大な問題に直面します:k-meansは、すべての属性が同じ重要性を持つという仮定に基づいています。そして、DFTはまったく逆の考え方に基づいています。最初のコンポーネントは信号の大部分をキャプチャし、後のコンポーネントはそれからわずかにずれています(これは次元削減としてこれを使用するための非常にモチベーションです)。 この直感に基づいて、にすると、DFT係数にk-meansを適用する必要はありません。同時に、データマイニングは「統計的なナンセンス」であるappfoachesが有用な結果をもたらすことができることを繰り返して示しています。あなたは試してみることができますが、あなたの結果を注意深く検証し、あまりにも熱心で楽観的であることは避けてください。

+0

私の研究の目的は、クラスタリングや分類などのデータマイニングタスクを実行する能力の順に異なる時系列次元削減技術をベンチマークすることです。 – user1143110

+0

私は必ずDFTテクニックのためのあなたのガイドラインに従います。 – user1143110

0

FFTを使用して、データセットをdft信号に変換します。小さなデータセットごとにDFTを計算するのに役立ちます。