私は1684の測定を行う60個のセンサーのデータセットを持っています。私は実験中に使用されたセンサの数を減らし、残りのセンサデータを使用して、除去されたセンサを(機械学習を使用して)予測することを望む。相関変数のグループでは、どの変数のサブセットが残りの変数を最もよく表しているかを推測できますか?
私はデータ(image参照)を見て、センサー間の強力な相関関係を明らかにしました。これにより、Xセンサーを取り除き、残りのセンサーを使用してその動作を予測できるはずです。
残りのセット(60-X)を最も正確に予測するセンサー(X)のセットを「得点化」できますか?
pcaを取る。今は2つのグループ、例えば20インチと240インチを持っています。ランダムに割り当てることから始めます。これはかなり良いはずです。今、両方のグループのpcaを取って、代表グループのpcaがグループ全体のpcaに近づくかどうかを調べるためのスワップを提案します。 –
グループをランダムに作成するのではなく、できないでしょうか。 1)各変数の元のデータと第1の主成分(PC1)の相関を計算する 2)PC1との相関が最も悪いセンサを削除する –