私は分類子をテストしたいデータがあります。 このデータには多くの属性があり、ターゲットクラスはバイナリtrue/falseです。 また、データは1-32と呼ばれる32のソースから得られることがわかります。 この情報はarffファイルにあります。名目値に基づくWeka-cross検証
だから私はarffファイルがあります:私は、例えば、クロスバリデーション4倍を選択することができる分類器の下にWEKAエクスプローラで
@attribute <MANY ATTRIBUTES>
@attribute <MANY ATTRIBUTES>
@attribute class {True,False}
@attribute source {1,2,3,4,5,6,7,8,9,...,30,31,32}
を。 しかしwekaはそのインスタンスをランダムに4個のビンに並べます。私が望むのは、wekaが列車として24のソースを使用し、テストとして8を使用するということです。 したがって、各ソースは完全にテストまたは列車のいずれかにありますが、両方ではありません。
オンボードの方法で何とかできますか?
https://stackoverflow.com/questions/47683638/preserve-order-for-cross-validation-in-weka/47688033#47688033 – zbicyclist
istは保存順序のみをサポートしているため(私の場合は)「ソース」ごとに同じ量のインスタンスがあれば(おそらく)役立ちます。それはそうではありません。 – user1270045