私は外れ値を座標とグループでRで見つける必要があります。RでX座標とY座標を持つグループ別にデータフレーム内の異常値を見つけるには?
マイデータフレームは次のようになります。
22334444
22335544
11335552
しかし、私は自動でグループが異常値を得ることができませんでした:
Name, Group, X, Y
Bob, 2, -300, 20
Karl, 4, 200, 10
Sara, 2, -298, 19
Hans, 4, 210, 12
Anna, 3, -700, 100
Maria,3, -690, 110
Lars, 2, 100, 50
etc.
私は次のようになりますグループによる散布図を作るために管理しました新しいデータフレームとしてのクラスタリング(最近傍点?)
(ラースのように、彼は遠く離れてグループ2から、他の人からである)
グループによってあなたの行列をサブセットループについてどのようにOutliers_DF
Name, Group,X, Y
Lars, 2, 100, 50
Sam, 3, 900, 70
Trixi, 11, 200 , 2
グループごとにデータフレームをサブセット化して、グループごとに行列を与え、それぞれに 'hclust(dist())'を実行する方法はありますか?外側のノードはより大きな高さでマージされます。 – Joe
私は、1つのグループでhclust(dist(df [、5:6]))を使ってみました。 コール: hclust(D = DIST(DF [5、6])) クラスタ方法:完全 距離:オブジェクトの 数ユークリッド:2 5及び図6は、私はこれを取得し、XおよびY columsあります私はここから何をするべきかを理解していません – JonaH
あなたはいくつの観察とグループを持っていますか?おそらく私たちにあなたのdfのより大きなサンプルを与えるでしょう。 – Joe