2017-11-19 19 views
0

プログラミングとRの新機能です。現在、非常に大きなデータセット(300列と400k行)を扱っています。列の中には数値形式(例:いくつかの列には顧客ID、国名、都市名などが含まれます)R-ビッグデータセットの相関行列

これらの列を無視して、通常は95より大きい、そのような列は、ML内にノイズを生成するだけであり、特徴の縮小に使用することができる。 列1列2の相関: のxyz CVG 0.964 XYZ yut 0.951 yutのCVG 0.967

あなたはより多くの情報が必要なら、私を知ってみましょう。このような

何か。あなたの時間をありがとう。

よろしく、利用可能な詳細とあなたの問題を理解しようと InWoods

答えて

1

は、あなたの基本的な問題は、あなたのdata.frameから数値列を抽出するように見えます。開始するにはis.numeric()の機能を見てください。