ツリーを希望の数にカットする方法を示すために、Rで利用可能なデータセットを使用します。結果はテーブルです。
hclustオブジェクトを作成します。
hc <- hclust(dist(USArrests), "ave")
#plot(hc)
これで、ツリーを必要な数のブランチに分けることができます。私の次のトリックのために、私は2つのグループにツリーを分割します。 k
パラメータでカット数を設定します。 ?cutree
とパラメーターh
の使用を参照してください。より有用な場合があります(cutree(hc, k = 2) == cutree(hc, h = 110)
参照)。
cutree(hc, k = 2)
Alabama Alaska Arizona Arkansas California
1 1 1 2 1
Colorado Connecticut Delaware Florida Georgia
2 2 1 1 2
Hawaii Idaho Illinois Indiana Iowa
2 2 1 2 2
Kansas Kentucky Louisiana Maine Maryland
2 2 1 2 1
Massachusetts Michigan Minnesota Mississippi Missouri
2 1 2 1 2
Montana Nebraska Nevada New Hampshire New Jersey
2 2 1 2 2
New Mexico New York North Carolina North Dakota Ohio
1 1 1 2 2
Oklahoma Oregon Pennsylvania Rhode Island South Carolina
2 2 2 2 1
South Dakota Tennessee Texas Utah Vermont
2 2 2 2 2
Virginia Washington West Virginia Wisconsin Wyoming
2 2 2 2 2
これは役に立ちます。 http://stackoverflow.com/questions/28378113/match-and-add-the-cluster-number-to-the-original-data/28384937#28384937 – EskimoT