フィーチャ選択データセットで予測しようとしたときに発生した1つの問題フィーチャを選択すると、テストデータセットを予測する場合、テストデータセットのフィーチャが整列しない訓練データセットは特徴選択のために特徴が少ないからである。テストデータセットがトレーニングデータセットと同じ機能を持つようにフィーチャ選択を適切に実装するにはどうすればよいですか?フィーチャ選択の実装
例:私はあなたがSelectKBest
最初にしてtransform
テストデータをフィッティングすることによりfeature_selectorオブジェクトを作成したいと考えてい
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
iris = load_iris()
X, y = iris.data, iris.target
X.shape
(150, 4)
X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
X_new.shape
(150, 2)
...そして* fit_transform'' *使用いけないが、ちょうど 'transform'。 –
@ juanpa.arrivillaga私の唯一の懸念は、テストデータセットにフィーチャ選択を実装するときです。トレーニングデータセットのフィーチャセットとは異なるフィーチャセットを取得する可能性はありますか? – user
その理由のために、テストデータであなたは*選択しません。 –