2016-07-17 6 views
1

連載分析(マーケット・バスケット分析かもしれない)を私のシステムに組み込むための最初のステップを理解するために何度も記事を調べました。彼らはアルゴリズムの実装に深く関わっていますが、データを最初に格納する方法については誰も話しませんでした。 誰かが私に始めることができるスタート・ポインタや記事のリンクを私に与えることができたら本当に感謝します。連想ルール分析またはマーケットバスケット分析をゼロから実装する方法は?

まず、私が実装したいのは、ユーザーのクリックを追跡し、追跡されたデータに基づいて提案を提供することです。 など。ユーザーはリンクAをクリックしてリンクBとリンクCをクリックしました。このアクティビティは(ユーザー、ユーザー組織、ユーザー役割など)関連するメタデータで追跡できます。将来的には、同様の用途の数をシステムに追加し、それをスマートにしたいと考えています。例えば。ユーザがフィールドAとBの値を設定した場合、フィールドCに値<bla>が設定されます。

私のシステムでは、1日に数千のデータポイントが生成されることがあります。

以下の私の質問は以下のとおりです。

  1. がどのように私は私のデータを保存する必要がありますか? SQLまたはNo SQLを実行する(簡単にMongo DBを見て、それが有望だったと思う)

  2. どのようなツールを使用して連想分析を行うべきですか?私が使用できるオープンソースツールはありますか?それが依存

答えて

2
  1. 。あなたのデータはNoSQLデータベースに適していますか?この質問に答えるには、CAP定理とケーススタディをお読みください。https://en.wikipedia.org/wiki/CAP_theoremまたはhttp://robertgreiner.com/2014/06/cap-theorem-explained/ 。 (データに応じて)一貫性と可用性=を求めて、Mysqlのようなリレーショナルデータベースを使用することをお勧めします(ケーススタディを読み、データを分析して最適なツールを選んでください)

  2. オープンソースのライブラリのいくつかの概念とアルゴリズムを読んでいる方がいいと思います。 Apriori,ECLAT,FP-GROWTHアルゴリズムを検索してそれらの概念を取得してみてください。ツールを選択するか、自分のコードを書くことができます。いくつかの便利なツール(プログラミング言語に依存):

のPython:https://github.com/asaini/Apriorihttps://github.com/enaeseth/python-fp-growthhttps://github.com/enaeseth/python-fp-growth/blob/master/fp_growth.py

PHP:https://github.com/sigidhanafi/fp-growth-php

JAVA:https://github.com/goodinges/FP-Growth-Javahttp://www.philippe-fournier-viger.com/spmf/

また、あなたがスパークを使用することができます:https://spark.apache.org/docs/1.1.1/mllib-guide.html

+0

こんにちはMasoud、私はあなたが提供した資料を通った、これは本当に良い情報です。どうもありがとう。私たちが使用し終わったものを説明する完全なシステムを用意したら、このスレッドを更新します。 – Manan

+0

こんにちは、確かに、それは誰もがARの実装に新しいことができます – Masoud

関連する問題