2017-05-14 11 views
0

Googleのウェブサイトのトラフィックに関するデータを収集します。その結果、1日あたりの訪問数は約50〜100万で になります。ドルイドコホート分析?

コホート分析:

ウェブサイトで登録して、実際に私たちの購入ページに移動し、24時間以内にユーザーの割合を探す(ユーザーが最初以内にこれを行うどのように多くの 割合を計算します第2、第3等 時間後に登録)。

2つの非常に簡略サンプル文書:

  • セッションID:イベント

{のUNIXタイムスタンプ:コホート

  • 時間を評価するためのURL:カウント
  • URLを実施するための私たちのユニークな識別子 "sessionId": "some-random-id"、 "time":1428238800000、(unixタイムスタンプ:4月5日、午後3:00) " URL ": "/登録" }

    { "セッションID": "いくつかのランダム-ID"、 "時間":14282.415億、(Unixタイムスタンプ:4月5日15:45) "URL" :私は6ヶ月 &、と言うの期間、同じ集計を行いたい場合は }

    を「/買い」の顧客を返すためのコホートを行うチェックしたいと思いますか? データセットは非常に大きくなります。

    注:100%正確な結果を得ることにも興味はありませんが、 は傾向分析には十分です。

    ドルイドでこれを達成できますか?それとも、この種の分析には適していませんか?コホート分析を行う上で優れていることは他にありますか?

  • 答えて

    0

    私はドルイドとデータスケッチでこれを行うことができると思います。 最後の例を見てくださいpage この近似法を使いたい場合は、hereを見ると近似の限界誤差と精度のためにメモリを交換できるトレードオフを理解することができます。

    +0

    データスケッチを指していただきありがとうございます。 –