私は10倍CVを使用してデータセット全体でkNNクラシファイアを実行しようとしています。私はWEKAのモデルでいくつかの経験を持っていますが、これをSklearnに転送するのに苦労しています。Python/Sklearn - IndexError - インデックスが範囲外にある
以下は第47回属性がターゲットラベルである私は私のCSVではエラーに
>IndexError Traceback (most recent call last)
<ipython-input-19-8d9596c3368b> in <module>()
4 array = dataframe.values
5 X = array[:,0:47]
----> 6 Y = array[:,47]
7 num_folds = 10
8 kfold = KFold(n_splits=10, random_state=7)
> IndexError: index 47 is out of bounds for axis 1 with size 47
を取得する私のコード
filename = 'train4.csv'
names = ['attribut names are here']
dataframe = read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:47]
Y = array[:,47]
num_folds = 10
kfold = KFold(n_splits=10, random_state=7)
model = KNeighborsClassifier()
results = cross_val_score(model, X, Y, cv=kfold)
print(results.mean())
である - (?私は間違ってここにいる)ので、48。
私はJupyterノートブックでpandas/sklearnを実行しています。
おかげ
があなたのCSV列名を持ち、y'列 'ターゲットの列名何であるのか? – MaxU