0
私のGradle crossfoldタスクは次のようになります。crossfold再発生を防止する方法すべての反復Lenskit 3.0-M2
task crossfold(type: Crossfold, group: 'evaluate') {
input 'data/mt-500k.yml'
// test on same 1/5 of each user's ratings
holdoutFraction(0.2,'timestamp')
// use 5-fold cross-validation
partitionCount 3
//use partition users method
method 'partition-users'
}
MT-500Kデータセットは、すべての評価が含まれています。私のRAMの限られた量のため、私はアルゴリズムを分離して実行する必要があります。つまり、データが変更されていなくても、クロスフォールディングは繰り返し実行され、トレーニング/テストフォールドでは異なるユーザーになり、結果が比類のないものになります。同じクロスフォールドを維持したり、レンズキットが反復されるのを防ぐことはどうでしょうか? Lenskitは、他のすべての面倒を
dataSet 'build/crossfold.out/datasets.yaml'
: