私の質問はかなりシンプルですが、私はキャレットパッケージのドキュメントを使用して明確な答えを見つけることができません。 列機能で前処理オプションのセンタとスケールを使用すると、予測中に新しいプリセットが新しいデータセットに適用されることが記載されています。キャレットパッケージの予測関数は、前処理時に将来の情報を使用しますか?
したがって、予測の機能を使用する場合: トレーニングセットの平均とスケールが新しいデータに適用されることを意味しますか?または、新しいデータセットに新しいセンタリングとスケーリングが適用されるため、データがタイムシリーズ(問題がある)の場合、将来のポイントを使用する可能性がありますか?
は
あなたは 'キャレット:: predict.preProcess()'について話していますか?もしそうであれば、文書は、変換が訓練データからの推定値を使用してテストデータをセンタリング/スケーリングすると述べている。 – ddunn801
モデルを訓練し、新しいデータセットで使用したいときは、predict.trainについて話しています。 – mlal