私はモデルとは異なる方法でパフォーマンスを計算しようとしています。グリッド検索からモデルのcross_validation_holdout_predictions()を取得する
クロスバリデーション中に生の予測にアクセスしたいので、自分でパフォーマンスを計算できます。
g = h2o.get_grid(grid_id)
for m in g.models:
print "Model %s" % m.model_id
rrc[m.model_id] = m.cross_validation_holdout_predictions()
私はちょうど私のデータセットのモデルで予測を実行することができますが、私はモデルが前にこのデータを見て、またはしていないため、このテストはバイアスされるかもしれないと思いますか?同じデータセットに対して新しい予測を行い、それを使用してパフォーマンスを計算することはできますか?
ありがとう、エリン、もう一度!見逃した。どういうわけか、私はこれらの2つのオプションがグリッド検索ではないと思っていました。私は交差検証オプションを選択しなかったので、彼らはそこにいなかったと思う。私の悪い。ありがとうございました! –
問題ありません!任意のアルゴリズム引数( 'keep_cross_validation_predictions'を含む)を' H2OGrid'に渡すことができます。これはデフォルト以外の設定を使うようにアルゴリズムを変更する方法です(モデルのハイパーパラメータについても同じです)。ここの例:https://github.com/h2oai/h2o-tutorials/blob/master/h2o-open-tour-2016/chicago/grid-search-model-selection.ipynb –