2017-04-10 6 views
0

私のGradle crossfoldタスクは次のようになります。crossfold再発生を防止する方法すべての反復Lenskit 3.0-M2

task crossfold(type: Crossfold, group: 'evaluate') { 

    input 'data/mt-500k.yml' 
    // test on same 1/5 of each user's ratings 
    holdoutFraction(0.2,'timestamp') 
    // use 5-fold cross-validation 
    partitionCount 3 
    //use partition users method 
    method 'partition-users' 
} 

MT-500Kデータセットは、すべての評価が含まれています。私のRAMの限られた量のため、私はアルゴリズムを分離して実行する必要があります。つまり、データが変更されていなくても、クロスフォールディングは繰り返し実行され、トレーニング/テストフォールドでは異なるユーザーになり、結果が比類のないものになります。同じクロスフォールドを維持したり、レンズキットが反復されるのを防ぐことはどうでしょうか? Lenskitは、他のすべての面倒を

dataSet 'build/crossfold.out/datasets.yaml' 

答えて

0

は、それが評価タスク内のデータセット変数を変更するのと同じくらい簡単だということが判明します。

関連する問題