2016-10-10 18 views
0

これらの新しいセットに比例したクラス・サイズを保存するために、レイヤー・サンプリングを使用して、元のデータ・セットの75%と25%のサイズのトレーニング・セットとテスト・セットに分割する方法を教えてください。私はWEKAでこれをやろうとしています。WEKAの層別サンプリング

"RemovePercentage"フィルタは層別には行いません。また、 "StratifiedRemoveFolds"フィルタではパーセントでこれを行いません。

私は何か助けや提案をいただきありがとうございます。

答えて

0

したがって、回避策として、私はstratifiedRemoveFoldsを使用してデータセットを2つに分割しました。この場合、私の折り畳み数は2であり、50%〜50%のデータセットが得られた。次に、同じ方法を使用して折り畳みの1つを2つに分割し、元のデータセットの25%〜25%のサブセットを生成しました。次に、25%のデータセットの1つを左側に50%以上マージし、75%〜25%の層別スプリットを作成しました。これが私の目標でした。

関連する問題