解決するには次の問題があります。私はGoogleアナリティクスから、列A、因子変数(ユーザーID)、列B、セッションの日付、列Cのセッション数または他のメトリックRは毎週の使用量にデータを再計算します
テーブルを作成したいのですが、最初の列には係数があり、その後の列には1〜8週目が表示されます。 Rは、異なるユーザが異なる日付でウェブページを使用し始めたので、各週の最初のセッション日付に応じて各要素(因子)のセッション数を計算することである。これは、約8週間のプロジェクト中にユーザーがどのように関わったかを示すはずです。ここで
は一例です:任意のRパッケージを使用するCAが、私は希望
例:
df <- data.frame(
fac=c("a","a","a","a","a","b","b","b","b","b","c","c","c","c","c","d","d","d","d","d","d"),
date=c("2017-01-01","2017-01-05","2017-01-13","2017-01-25","2017-02-10","2017-01-06","2017-01-16","2017-01-28","2017-02-02","2017-02-07","2017-01-11","2017-01-19","2017-01-24","2017-01-31","2017-02-09","2017-01-12","2017-01-24","2017-01-29","2017-02-04","2017-02-19","2017-03-08"),
sessions=c(1,2,3,6,5,1,3,2,3,3,1,5,3,2,4,1,3,5,2,6,6)
)
は次のようになります。可能であれば、ループを回避するのが好きです。
同様の方法論を使用することができます:週カレンダー週を表すものではありませんが、むしろ、最初のイベントの日付は、最初に決定します8週間の実験の最初の週の日、開始日が何であっても。したがって、データフレームは8週間の要素で構成されます。 –