2017-02-02 5 views
0

私は現在、3次元連続変数(x、y、z)を持つ機械学習分類問題に取り組んでおり、すでに離散変数である時間(t)を追加したいと考えています。データがどのように表示されるかの例:連続3次元変数の離散化

 x     y     z     t 
[0.1 ,2.6, 0.0] [0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0]   1486033702474 

各連続変数の平均をとることはできますか? これらの変数を表現/書式化して、Pythonの任意のMLライブラリにトレーニングデータセットを作成するにはどうすればよいですか?

+0

データタイプを明確にすることはできますか。最初のベクトルxは時間内にあるか、各要素はx、y、zに対応していますか?あなたのデータを展開してください... – mik

+0

@mikすべての要素(x、y、z)は、時間範囲に基づいて同じサイズのベクトルを生成します。t2-t1 – binkabir

答えて

1

計算の変数は、常に離散です。コンピュータはデジタルマシンであり、有限の速度でしかデータをサンプリングできないため、「連続」という用語は単純に適用されません。データの粒度を小さくしたい場合は、状況に応じて平均値をとることが有効です。 Pythonでデータリストの平均をとる:

mean_x = sum(x) * 1./len(x) 
+0

ありがとうWoody1193、意味のあるものがあるかどうか試してみますでる。 – binkabir

+0

意図したとおりに動作しない場合は、戻って変数の意味を考えてください。彼らの意味の核心を引き出す方法を考えてみてください。それは漠然としていますが、この分野の数学をマッサージするために必要な曲がりがあります – Woody1193

関連する問題