私はRで新しく、数百の異なる識別番号(患者である)を含む「ID」という列を含む「CT」というdata.frameを持っています。ほとんどの数値は一度表示されますが、他の数値は2〜3回表示されます(したがって、異なる行に表示されます)。 CT data.frameでは、「countID」という新しい変数を挿入したいと思います。これは、これらの特定の患者の出現回数を示します(複数のレコードが複数回表示されるはずです)。 第一の戦略: 私はこのフォーラムを読んだ後、二つの異なる戦略を試してみました列内の出現数をカウントして変数を作成する
CT <- cbind(CT, countID=sequence(rle(CT.long$ID)$lengths)
しかし、このdoesntの仕事は、私は一つだけカウントを取得します。 第二の戦略:
tabs <- table(CT.long$ID)
out <- data.frame(item=names(unlist(tabs)),count=unlist(tabs)[],stringsAsFactors=FALSE)
rownames(out) = c()
head(out)
# item count
# 1 1.312 1
# 2 1.313 2
# 3 1.316 1
# 4 1.317 1
# 5 1.321 1
# 6 1.322 1
だから、これは正常に動作しますが、私は2 data.framesを溶かすカント:CTと、このデータフレームを(1カウントされ、1がIDです)2列を持つデータフレームを作成し、一致行数が "out"と "CT"の間で一致しません(outには行が少なくなります)。 誰かが、data.frame CTに直接出現回数を追加するか、2つのdata.framesを正しく一致させるための洗練されたソリューションがありますか?事前に おかげで、デニス
1の方法が、次を提供しますあなたが投稿する時に、いくつかのデータを含めることによってあなたの例[** reproducible **](http://stackoverflow.com/q/5963269/1478381)を作成してください。ようこそ! –