2017-03-07 5 views
0

私はkmodes pythonライブラリを使用しています。パラメータの意味を説明できる人がいますか?Python:Kモードの説明

リンク:私はn_clustersを知っ https://github.com/nicodv/kmodes#huang97

km = kmodes.KModes(n_clusters=4, init='Huang', n_init=5, verbose=1) 

は、グループへのクラスタへのデータの数であるが、他のパラメータは何ですか? source codeから

答えて

2

n_initはアルゴリズムが実行される回数は、これらの独立した実行から選ば最高出力と、あるとき

Parameters 
    ----------- 
    n_clusters : int, optional, default: 8 
     The number of clusters to form as well as the number of 
     centroids to generate. 
    max_iter : int, default: 300 
     Maximum number of iterations of the k-modes algorithm for a 
     single run. 
    cat_dissim : func, default: matching_dissim 
     Dissimilarity function used by the algorithm for categorical variables. 
     Defaults to the matching dissimilarity function. 
    init : {'Huang', 'Cao', 'random' or an ndarray}, default: 'Cao' 
     Method for initialization: 
     'Huang': Method in Huang [1997, 1998] 
     'Cao': Method in Cao et al. [2009] 
     'random': choose 'n_clusters' observations (rows) at random from 
     data for the initial centroids. 
     If an ndarray is passed, it should be of shape (n_clusters, n_features) 
     and gives the initial centroids. 
    n_init : int, default: 10 
     Number of time the k-modes algorithm will be run with different 
     centroid seeds. The final results will be the best output of 
     n_init consecutive runs in terms of cost. 
    verbose : int, optional 
     Verbosity mode. 

だからinitは、単に初期化のために使用される方法です。

verboseは、出力がstdoutにどのくらい渡されるかを指定します(つまり、アルゴリズムがどの段階にあるかなど)。