0
私が持っているデータセットは、お互いを知っているサンプルでグループ分けされています。つまり、同様の条件で同様の条件で作成されました。 列車試験データセットの残高は重要であるため、列車または試験に乗る必要がありますが、分離することはできません。だから私のscikit-learnコードで使うのは簡単ではありません。私はいくつかのファイルのテストにひだを作り、「本物」を作りたい場合に非常に便利な快適とないではありませんファイルで区切られたデータセットの相互検証
train ~> cat ./dataset/!(1.txt)
test ~> cat ./dataset/1.txt
:今、私のようなものを作るルーに似たものを使用しています
履歴書。 実際のオーバーフィットをチェックするには、どのように良いCVを作ることが可能でしょうか?