連続変数を固定数のバケットにバケットを入れて境界が重ならないようにする方法はありますか?連続変数を別々の境界バケットにバケットにまとめる
例:私は302 1s、120 2sと3から40までの範囲の他の値の束を持つ500の数字を持っているとしましょう。どのように私は5つのビンにバケツを配布を見ていないのですか?
パーセンテージバケットは1,の3つのバケットに存在する1を意味しますが、それらはすべて効果的に1つのビンです。
連続変数を固定数のバケットにバケットを入れて境界が重ならないようにする方法はありますか?連続変数を別々の境界バケットにバケットにまとめる
例:私は302 1s、120 2sと3から40までの範囲の他の値の束を持つ500の数字を持っているとしましょう。どのように私は5つのビンにバケツを配布を見ていないのですか?
パーセンテージバケットは1,の3つのバケットに存在する1を意味しますが、それらはすべて効果的に1つのビンです。
私は使用することをお勧めします。クラスタ分析手順の1つ(例えば、proc fastclus
)、5つの1-dクラスタを要求する。
GROUPSでPROC RANKを使用してグループ数を指定します。いくつかのメソッドを指定することもできますが、それらはすべてパーセンタイルベースです。