2017-03-17 14 views
0

私は15k行45列(整数、日付、文字列、ブール値などを含む)のデータフレームを持っています。R:重複と同じインデックスのインデックスベクトル

var1 var2 var3 FS 12 31.12.2016 BX 65 30.06.2016 BI 28 31.03.2016 FS 12 31.12.2016

これらの行のうちのいくつかは同じです。私はハッシュ関数を使用することができ

index var1 var2 var3 1 FS 12 31.12.2016 2 BX 65 30.06.2016 3 BI 28 31.03.2016 1 FS 12 31.12.2016

、それは元の行を破壊するであろう:私は今、この例では第一のように、同一の行と4行目のために、同一のエントリを持つインデックスのいくつかの種類を含む追加の列を必要とします注文。理想的には、私の例のように増加する数字になるでしょう。
私はduplicated()で私の運を試しましたが、主に重複排除を目的としているようです。
また、すべての行を比較して正しいインデックスを導出するためにループを書くこともできますが、これを行うためのよりエレガントな方法があります。

+2

'as.numeric使用することができます(as.factor(適用を(DF、1、ペースト、崩壊= " - ")))' –

+1

1で始まっていないこと、それは絶対に私の必要性に合っています。素早く助けてくれてありがとう! – Fiete

答えて

1

あなたは常にdplyr

library(dplyr) 
df=data.frame(var1=c("FS","BX","BI","FS"),var2=c(12,65,28,12)) 
df2 = df%>%group_by(var1,var2)%>%mutate(index=row_number())%>%ungroup() 
関連する問題