2016-09-18 13 views
0

私はをpythonで使用して、ランダムフォレストを使用した5倍交差検証モデルからモデルを保存しました。結果として、私はMDL_1.pkl, MDL_2.pkl, MDL_3.pkl, MDL_4.pkl, MDL_5.pklとして保存された各データセットに対して5つのモデルを持っています。今私は、外部データセットの各行の最終予測が平均5つのモデルである場合に、predict_probaを使用して外部データセットの予測にこれらのモデルを使用したいと考えています。何が最善の方法を進めるのですか? ご協力ありがとうございますランダムフォレストのモデルを使用して外部データセットを予測する

答えて

0

まず、相互検証の結果を保存しないでください。クロスバリデーションであり、トレーニング方法は、評価方法はです。 という単一のモデルをデータセット全体に構築し、それを使って予測する必要があります。

何らかの理由でモデルを訓練できなくても、この5つの予測を平均化して使用することができます(ランダムなフォレスト自体は木々の平均的な集合体なので、戻って再訓練するとbetter結果。

関連する問題