2009-09-02 15 views
2

私は私の会社のウェブサイトのログテーブルを分析する作業を担当しました。この表には、特定のセッションのWebサイト全体にわたるユーザーのクリックパスが含まれています。私の会社は、ユーザーの「クリック経路」に基づいて傾向を把握/把握しています。そうする際に、年齢や地理などに基づいて特定の「クリックパス」を取るユーザーのグループを特定します。マイクロソフトビジネスインテリジェンス。私は何をしようとしていますか?

あなたは、私が思っていたので、私はBIとその機能を完全に新しいです、タイトルから言うことができるように:

  1. を私たちの目標は達成可能か?
  2. これを行うにはどうすればよいですか?

私は現在、私が見つけた他の電子書籍とオンラインの本を読んでいます。すべての徴候は、これが配列クラスタリングによって可能であることを示唆しているようである。正確な実装と調整は、現在私の上に失われていますが。したがって、誰かがそのような事業で最初の手の経験を持っていれば、ここでそれを分かち合うことができたらすばらしいでしょう。

乾杯!

答えて

0

neural networksをそのタスクに使用できるようです。おそらくperceptrons

私はニューラルネットワークに関するいくつかの経験がありますが、私は専門家ではありません。
本を強くお勧めします。Programming Collective Intelligence: Building Smart Web 2.0 Applications. Pythonを知らなくてもそれをチェックしてください。 Webサーバのログファイルの読み取りが非であるよう

0

まず第一に、オープンソースや商用のウェブ解析ソフトウェアパッケージ(そのためにアップグーグル)とのスタートは、些細な

いくつかは、他のテーブルにマッピングデータ(年齢とともにユーザーテーブルを許可しますなど)、またはWebセッションログを他のデータとマッピングする独自のソリューションを融合してください。

通常のSQLクエリ以外では、アナリストの問題を解決します。

select user.id 
from user, log l1, log l2, log l3 
where user.id = l1.userid and l1.type = first step 
    and user.id = l2.userid and l2.type = next step 
    and user.id = l3.userid and l3.type = last step 
    and l1.sessionid = l2.sessionid and l2.sessionid = l3.sessionid 

生データをBIフレームワークにロードしても、それほど簡単ではありません。このようなクエリの結果をBIフレームワークにロードすると、センスが得られます

Webアプリケーションによっては、実行中のセッションIDなどの変更やセッションIDの変更があった場合に、アクタセッションを特定できない場合があります。それが問題であれば、ウェブアナリティクスを実際のWebサーバーコードにロールバックして、長時間の実行状態をシミュレートしてその代わりに記録する必要があります。

2

既存のログファイルでこの文句を言わないあなたを助ける...(しかし、答えのためのあなたの検索が失敗した場合、それは、代替である)

Google Analyticsは無料で、あなたはいくつかのカスタム変数{年齢を設定することができます、など}とトラフィックがどこに行く参照してください(あなたは、個々のユーザーが何を参照してくださいすることはできません..)あなたが自由にしようとしているときに正確ではなく、あなたが探しているものに近くなるようにすることができます

本当に良いアナリティクスはOmniture(高価)に見えますが、複雑なウェブサイトのレポート作成のための一番上です。多くの電子商取引シナリオでは、ユーザがどのようにサイトに来て、どのようにサイト+と対話しているかを追跡しています〜

自分自身を「ローリング」する前に、自分の目標に集中するのに役立つかもしれません。

+1

私はこれをもう一度やります。私は昨年、BIの審判員の一部を調べました(私たちはそれらを使用していませんでした)。あなたが適切にそれをやりたいのであれば、かなり急な学習曲線があります。 – Paddy