2016-04-08 3 views
-1

EMクラスタラーを使用して43574時系列をクラスタリングしました。出力は24クラスタです。私はここにいくつかの質問があります。まず、24のクラスタを処理することは実際には有用なのですか?それはあまりにもないですか?神経外科医に結果を渡す場合、患者の管理の目的でこれらのクラスターが機能するでしょうか?私の最も重要な質問は、以下に示すようにクラスタのカップルは0%の可能性があるということです。どういう意味ですか?なぜ彼らは異なるクラスターにいるのですか?任意の助けを大幅に高く評価されるだろう、そして、これは私が得たものである:EMいくつかのクラスタでlog likelihoodが0のwekaを使用したクラスタリングはありますか?混乱している出力

0 1892(4%) 1 5153(12%) 2 1594(4%) 3 1221(3%) 4 122(0 %) 5 2714(6%) 6 7092(16%) 7 141(0%) 8 166(0%) 9 464(1%) 10 3331(8%) 11 4316(10% ) 14 2411(6%) 15 2573(6%) 17 3063(7%) 18 142(0%) 19 4211(10%) 20 925(2%) 21 2038(5%) 22 5(0%)

答えて

0

これらの値は、尤度ではなく、サイズ

data=array([1892, 5153, 1594, 1221, 122, 2714, 7092, 141, 166, 
    464, 3331, 4316, 2411, 2573, 3063, 142, 4211, 925, 2038, 5]) 

for f in data * 100./sum(data): print "%.1f%%" % f, 

精度の追加の数字で次の相対クラスタサイズが得られる:

4.3% 11.8% 3.7% 2.8% 0.3% 6.2% 16.3% 0.3% 0.4% 1.1% 7.6% 9.9% 
5.5% 5.9% 7.0% 0.3% 9.7% 2.1% 4.7% 0.0% 

これらは尤度ありません。それはクラスタサイズ/データセットサイズです。

+0

Anony、すべてが0%の5つのクラスタを定義するのはどういう意味ですか?あなたが言ったように、クラスタのサイズ。そのクラスタでデータを分類できない場合、なぜそのクラスタを取得するのですか?なぜ私は1の代わりにいくつかの0%を得るのですか? – Parisan

+0

絶対0.0000000%ではなく5/43574です。それは確率でもない。ただ5つのオブジェクト**を持つ非常に小さなクラスタです。おそらく異常値や悪い前処理。 –

+0

ありがとうAnony。意味をなさない – Parisan

関連する問題