2016-10-03 5 views
0

このライン不満:とValueError:形状(2,2)及び(4,6)整列していない:2(1薄暗い)= 4(0薄暗い)

log_centers = pca.inverse_transform(centers) 

コード:

# TODO: Apply your clustering algorithm of choice to the reduced data 
clusterer = KMeans(n_clusters=2, random_state=0).fit(reduced_data) 

# TODO: Predict the cluster for each data point 
preds = clusterer.predict(reduced_data) 

# TODO: Find the cluster centers 
centers = clusterer.cluster_centers_ 

log_centers = pca.inverse_transform(centers) 

データ:

log_data = np.log(data) 

good_data = log_data.drop(log_data.index[outliers]).reset_index(drop = True) 

pca = PCA(n_components=2) 
pca = pca.fit(good_data) 

reduced_data = pca.transform(good_data) 

reduced_data = pd.DataFrame(reduced_data, columns = ['Dimension 1', 'Dimension 2']) 

データは、CSVです。ヘッダーは次のようになります。

Fresh Milk Grocery Frozen Detergents_Paper Delicatessen 
0 14755 899 1382 1765 56 749 
1 1838 6380 2824 1218 1216 295 
2 22096 3575 7041 11422 343 2564 

答えて

0

問題はpca.inverse_transform()が引数としてclustersを取るべきではないということです。あなたはdocumentationを見れば

確かに、それはPCA から得られたデータがあなたの元のデータない関数kmeansで得重心に適用すべきです。

関連する問題