非常に単純なコードをRで書いていますが、データ> 2.000.000行に使用するとほぼ2時間かかります。else loop in R
コードを改善する機会はありますか?私は可能な限り簡単な解決策を望んでいます。
私のRスキルは大丈夫です(経験< 1年)が、この場合は限界に達しました。 Furthemore他のループの場合、スピードアップに関するいくつかの記事を読んだが、どの戦略が自分のコードに最も適しているかわからない(例:Vectorise、ifelse、Parallelismなど)
ありがとう。
system.time(
for (i in 1:(length(mydata$session_id)-1)){
if (mydata$session_id[i] != mydata$session_id[i+1]){
mydata$Einstiegskanal[i]="1"
} else {
mydata$Einstiegskanal[i]="0"
}
}
)
# 6877,1 Seconds = 1,91 h
'ライブラリ(dplyr); MYDATA%>%に変異(Einstiegskanal = ifelse(SESSION_ID =ラグ(SESSION_ID)、 "1"、 "0")!)' – ExperimenteR