2016-08-06 2 views
1

私は自分のデータを増強しています。クロスバリデーション中に関連するデータが異なるフォールドに分割されていないことを確認したいと思います。scikit-learnのラベル付きkfoldクロスバリデーションと同等のR /キャレットがありますか?

私はscikit-learnにラベル付きk-foldアルゴリズムがあることがわかります。これは、データセットとともにラベルのリストを取り込み、2つの異なる折り目で同じラベルが見つからないことを保証します。 Rにこれと同等のものがありますか?私は私の回帰モデリングのためにキャレットパッケージを使用しています。

答えて

0

mlr packageのような機能があるようです。 'blocking'オプションは、リサンプリングが発生したときに、ブロック内のすべての観測を一緒に含める必要があることを具体的に指定します。キャレットパッケージにあまり付けられていない場合は、これを使用することを検討してください。

+0

できるだけキャレットを使用することをお勧めしますが、私はそれを考慮に入れます。ありがとうございました。 – Alex

関連する問題