2017-07-30 5 views
0

私はPythonでの機械学習のいくつかの基本を学んでおり(scikit-learn)、K最近傍アルゴリズムを実装しようとすると、エラーが発生します:ValueError:不一致のサンプル数を持つ変数:[426、143]。私はそれに対処する方法がわかりません。
これは私のコードです:"不一致な数のサンプル" - scikit - learn

from sklearn.datasets import load_breast_cancer 
from sklearn.model_selection import train_test_split 
from sklearn.neighbors import KNeighborsClassifier 
cancer = load_breast_cancer() 
X_train, y_train, X_test, y_test = train_test_split(cancer.data,cancer.target, 
                stratify = 
                cancer.target, 
                random_state = 0) 
clf = KNeighborsClassifier(n_neighbors = 6) 
clf.fit(X_train, y_train)` 

答えて

1

train_test_splitは、あなたの代わりにトレーニングデータとテストデータにフィッティングされているので、あなたは間違った変数に戻り値を割り当てたためX_train, X_test, y_train, y_test

にタプルを返します。トレーニングデータとトレーニングラベルの

それは私が恥ずかしい..とても簡単だった

X_train, X_test, y_train, y_test = train_test_split() 
+0

でなければなりません。ありがとう:) – Hendrra

関連する問題