ロードされたarffファイルから列車とテスト変数を作成します

マルチラベル分類を実行します。 Aはロードするarff形式のデータセットを持っています。しかし、私はsklearn/train_test_splitを適用するためにインポートデータをXベクトルとYベクトルに変換する方法は今ではありません。ロードされたarffファイルから列車とテスト変数を作成します

XとYを取得するにはどうすればよいですか？

data, meta = scipy.io.arff.loadarff('../yeast-train.arff') 
df = pd.DataFrame(data) 

#Get X, y 
X, y = ??? <--- 

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

出典

2017-09-05 user1649606

「yeast-train.arff」はどこからダウンロードしましたか？あなたの 'y'である' data'の中に列がなければなりません。そして、他の全ての列（ターゲット列 'y'を除く）は' X'になります。 –

[こちら]（http://sourceforge.net/projects/mulan/files/datasets/yeast.rar）からダウンロードします。 – user1649606

です。フィーチャーが列Att1, Att2, Att3.... Att20にあり、ターゲットが列Class1, Class2, .... Class14にあるマルチラベルデータです。

これらの列を使用してXとYを取得する必要があります。これは好きですか？

# Fill the .... with all other column names 
feature_cols = ['Att1', 'Att2', 'Att3', 'Att4', 'Att5' .... 'Att20'] 
target_cols = ['Class1', 'Class2', 'Class3', 'Class4', .... 'Class14'] 

X, y = df[feature_cols], df[target_cols]

出典

2017-09-07 09:08:10

ロードされたarffファイルから列車とテスト変数を作成します

答えて

関連する問題