2017-08-07 19 views
0

tabpyを使用しているときにこの問題が発生しています。私は、サンプル使用しています - supterstoreデータセットを、と私は合計([利益])を使用して、サブカテゴリーをクラスタ化するとの和([売上])が、それはエラーを返します:tabpy接続の問題[tableau&python]

ValueError : n_samples=1 should be >= n_clusters=2.

は、ここに私ですスクリプト:

SCRIPT_str(" 
    from sklearn.cluster import KMeans 
    kmeans = KMeans(n_clusters=2) 
    tmp=[] 
    for i in range(len(_arg1)): 
     tmp.extend([[_arg1[i],_arg2[i]]]) 
    KMmodel = kmeans.fit(tmp) 
    labels = KMmodel.labels_ 
    return labels", 
sum([Profit]),sum([Sales])) 
+0

'tmp = []'と2つの次の行ではなく、 'tmp = zip(_arg1、_arg2)'を使いたかったでしょうか? –

答えて

0

はあなたがnumpyのcolumn_stackを使用することができます1にN-クラスタオプションを変更してみてくださいと

+0

KMeansに、k = 1のクラスタのどれにクラスター化するべきかを「決定」させると便利なのはいつですか? –

0

をご確認ください。