2017-08-18 14 views
-1

データセットのXMeansクラスタリングソリューションを計算するには、アルゴリズムの説明でセンターを適切にシードする必要があります。Weka Xmeans:センターの初期化プロセス

WEKA Xmeansには、初期中心を指定するオプションがあります。さらに、他のXmeansライブラリでは、ユーザーはしばしば最初のセットのセンターを提供する必要があります。

ただし、何も指定されていない場合、初期中心を作成するためにWEKA xmeansライブラリーが行うかどうかは示されません。



何が提供されていない場合、どのようWEKAは初期のセンターを作るのですか?または、Xmeansアルゴリズムを適切に実行するために、初期センターを自分で生成する必要がありますか?

答えて

1

x-meansで定義済みセンターを使用することはできません。

サブセットで再帰的に機能するためです。

初期のkmin(通常は2)の中心を定義できます。しかし、それ以降に起こることを事前に定義することはできません。xmeansの目的はあらかじめkを知る必要がないことです。 kセンターをあらかじめ定義しておけば、となります。

+0

これは正しくないようです。明確にすることはできますか?私がこれを言う理由は、xmeansがkmeansを拡張し、kmeansが事前選択された中心を必要とするためです。このプロセスの方法論は重要です。さらに、wekaとpyclusteringのxmeansに関して、私は前者にセンターを提供することができ、後者にセンターを提供する必要があります。 – bordeo

+0

はい、最初のkmeansの部分集合で再帰的に動作します。 – bordeo

+1

最初のkmeansはk = 2の中心を持ち、主な前提はあなたがまだkを知らない*ということです。 –