2016-11-15 14 views
0

Rでトレーニングとテストセットに分割する必要があるデータセットがあります。それは多くの観測値を持ち、それぞれの時間(Q32008、Q42008、.. 。、Q42016)。R:グループ変数をランダム化して分割データセット

ランダムな四半期を使用して、特定の四半期のすべての観測が一緒になっているデータセットを半分に分割したいとします。たとえば、1つのデータセットはQ2 2009、Q4 2010、Q1 2008のすべての観測値を持ちます。splitを使ってみましたが、unsplitをランダムに2つの固有データセットに変換できませんでした。

アイデア?

+2

ようこそStackOverflow! [良い質問をする方法](http://stackoverflow.com/help/how-to-ask)と[再現可能な例を与える方法](http://stackoverflow.com/questions/)の情報をお読みください。 5963269)。これは他の人があなたを助けることをはるかに容易にします。 – Jaap

答えて

0

あなたが何を意味していたかわかりません。以下のコードは参考になりますか?

my.df = expand.grid(Quarter=paste0("Q",1:4),Year=2012:2016) 
my.df$Period = with(my.df,paste0(Quarter,Year)) 
my.df$x = rnorm(nrow(my.df)) 

# Randomly select periods for different data frames 
first.periods = sample(my.df$Period,nrow(my.df)/2) 
my.df$SplitID = as.numeric(my.df$Period %in% first.periods)+1 

# Split data frame 
split.df = split(x = my.df,f = my.df$SplitID) 
関連する問題