2017-06-13 4 views
0

私は基礎研究のために約400の健康な被験者からなる大きなデータセットを持っています。私はそれらをトランジションと検証コホートに分けたかったのです。私はランダムに分割することを考えましたが、年齢に大きなばらつきがあり、男性よりも女性の方が多いので、男性/女性比率が同じ/同じで、年齢も同様の2つのグループに一致させたいと考えました。トレーニングと検証のためのデータフレームの分割年齢と性別の一致するサブセット

差別化(患者さんやコントロールのような)がないので、あらかじめ一致するグループはありません。MatchItのように - パッケージです。

アイデアはありますか?

答えて

0

randomizrパッケージがお探しのパッケージである可能性があります。層別無作為化が可能になるため、トレーニングセットと検証セットの間でサンプルをランダム化し、年齢と性別で層別化できます。あなたはおそらく年齢ビンを作成してそれを機能させる必要があります。 randomizr

0

Z <- block_ra(block_var = gender) 

このようなものかもしれない、あなたが複数のものの上に層別化したい場合= 1

Zに男女それぞれの半分を割り当て、0と1のベクトルを作成します。

Z <- block_ra(block_var = paste0(gender, age_cat)) 

あなたは、同時に多くの変数に階層化する必要がある場合、私はblockToolsパッケージをお勧めしたいです。

関連する問題