Stacking、Stacked Generalizationアルゴリズム

スタッキングの仕組みを理解しようとしていますが、これまで正しく理解しているかどうかはわかりません。Stacking、Stacked Generalizationアルゴリズム

私の質問：

が、これはこれまでのところ、正しいですか？
私はしばしばスタッキングに何らかの形でクロスバリデーションが使用されていると読んでいますが、私は理解できませんでした。どのように使用されていますか？それとも、私が行方不明になっている、それは不可欠な部分ですか？

感謝

2016-10-11 Muidem

ご理解のほとんどは正しいです！ On

新しいデータセットは、元のデータセット+各基本学習者の予測と同じように見えます。

一つオリジナルの特徴+各基地学習者の予測を使用しますが、人々は、彼らは通常、各基地学習者の単なる予測を使用しているスタックの話をするときがあります。

スタッキングに何らかの形でクロスバリデーションが使用されていることがよくありますが、使用方法がわかりませんでしたか？それとも、私が行方不明になっている、それは不可欠な部分ですか？

はい、クロスバリデーションはスタッキングでよく使用されます。何が起こるかは、説明したように行うときに、データモデル全体を見て各予測が行われているので、ベースモデルの予測からメタモデル（レベル-1と呼ぶ）がオーバーフィットすることがあります。

それでは、クロスバリデーションを行い、データをk-フォールドに分割します。目に見えないデータで予測されるモデルの偏りのない推定値を得るために、k番目に保持されたフォールド（そのすべてのkを循環する）で予測を使用します。次に、それらにメタモデルを適合させます（そこに交差検証はありません）。

2016-10-11 16:29:16

答えて