8 clusters
に集団をクラスタリングする必要があります。私はproc fastclus
とk-means
メソッドを使用しています(クラスター間の分散を最小限に抑えるため)。観察はスコアを表すので、クラスタリングプロセスの後でさえ、それらは順序付けられたままであることが重要です。私はこのように気づいた:K-meansは、proc fastclus(SAS)による観察によるクラスタリングを意味します。
proc sort data=input.population;
by score;
run;
proc fastclus data = input.population
maxclusters = 8 list
out = score_clus
converge = 0.01 maxiter = 100
least = 2 noprint;
var score;
run;
手順は順序を維持しませんでした。私は別の結合を置くために使うことができる方法(おそらくprocのパラメータ)があります:分散を最小限に抑えながら、クラスタ内で順序付けられたスコアを維持します。