2016-08-09 11 views
-2

このコードはインターネットから入手します。私は自分のデータと仕事に適用します。だから私はこの方法の視覚化を試みようとしますが、私はk-メイドイドの視覚化の関連するコードを見つけることができません。Python K-medoidsの可視化

from nltk.metrics import distance as distance 
import Pycluster as PC 
words = ['apple', 'Doppler', 'applaud', 'append', 'barker', 
    'baker', 'bismark', 'park', 'stake', 'steak', 'teak', 'sleek'] 
dist = [distance.edit_distance(words[i], words[j]) 
    for i in range(1, len(words)) 
    for j in range(0, i)] 

clusterid, error, nfound = PC.kmedoids(dist, nclusters=3) 
cluster = dict() 

uniqid=list(set(clusterid)) 
new_ids = [ uniqid.index(val) for val in clusterid] 
for word, label in zip(words, clusterid): 
    cluster.setdefault(label, []).append(word) 
for label, grp in cluster.items(): 
    print(grp) 

答えて

1

ご入力されたデータは、言葉です。

どのように視覚化しますか?それらは座標ベクトルではありません。

+0

それを動作させる方法はありますか? levenshtein距離のような? – user2717427

+0

これはどのように視覚化に役立ちますか? Levenshteinは編集距離ファミリの一部です。 –