2017-09-18 11 views
-3

私はデータアナリストであり、私たちのウェブサイトのリアルタイム推薦エンジンを構築するように割り当てられました。パフォーマンスの良いリアルタイム推薦エンジンを構築するにはどうすればよいですか?

私は訪問者の行動を分析し、それらの入力に対してリアルタイム分析を行う必要があります。したがって、このプロジェクトについて3つの質問があります。

1)ユーザーは強制的にサインアップしません。検索や訪問履歴などのユーザー行動を取得する方法はありますか?

2)推奨モデルは事前にトレーニングすることができますが、予測プロセスに時間がかかります。どのようにパフォーマンスを改善できますか?

3)私はPythonスクリプトの書き方しか知りません。私のPythonスクリプトで推奨エンジンを実装するにはどうすればいいですか?

ありがとうございました。

===============

しかし、我々の顧客の90%は、彼らの最初の訪問時に製品を購入し、すぐに戻って来ることはありません。 新しい訪問者のための準備ができたモデルを作成することはできません。 そして、彼らは推奨エンジンにitemCFを使用することを好みます。それはしかし、私は答えるために最善を尽くします。これは、非常に広範な質問です...今は不可能ミッションのよう

+0

これは広すぎるためです。これまでどんなコードを試してみましたか? – toonarmycaptain

+0

私は実際にプロジェクトの提案をしてITベンダーに送付するように指示されました。私の現在の仕事の義務は、主にjupyterノートブックを使った分析レポートの作成のためです。したがって、Webアプリケーションをどのように作成するのか全く分かりません。 – DataHolic

+0

ありがとうございます。私は私の要件を満たすためにapache stormを実装しています。 – DataHolic

答えて

0

を鳴らし :

訪問履歴は、ドメイン上のトラッキング分析のいくつかのフォームを有効にすることによって追跡することができます。これは実装済みの事前構築されたソリューションであるか、ドメインのすべての訪問者の詳細な概要を提供します(通常は何らかのダッシュボードを使用します)。ほとんどの事前構築されたソリューションは、収集された分析を取得する方法を提供します。

もう1つの方法は、ブラウザのCookieを使用して、各訪問に関する情報を自分のドメインとその検索/ページ履歴に格納することです。この情報は、ユーザーが同じブラウザ内で訪問するたびにWebサイトで利用可能になります。ユーザーがあなたのウェブサイトにアクセスすると、情報を分析することができるサーバー/レストエンドポイントに情報を送信し(I.P/geolocation /訪問数/検索/ページ履歴)、それに基づいて推奨を行うことができます。別の一般的な方法は過去の購入を追跡することです。

パフォーマンスを向上させるには、特定のユーザーの予測モデルを常に次のサイトに訪問する準備が必要です。そうすれば、遅延はありません。しかし、ユーザーが初めて訪れると、詳細な予測を行うのに十分な情報がない可能性があるため、ジオロケーションに基づいてオプションを提供する必要があります(パフォーマンスに影響を与えることはありません)。

そのアプローチは主に、ウェブサイトをブラウジングするユーザーの行動に基づいて予測を行うことについて話されています。コンテンツベースのフィルタリングは、ユーザーが現在表示しているアイテムに類似するものを推薦する別の方法です。このアプローチは、カテゴリー、目的、使用法で似ているアイテムをデータベースに照会するだけで済むので、一般的に簡単です。

クライアントサイドのものにjavascriptを使用することはありませんが、推奨エンジンはPythonでビルドできます(アイテムデータベースにアクセスできる単純なREST APIエンドポイント)。ほとんどの人は、PythonでREST APIを実装するためにフラスコ、ジャンゴ、イブを使用します。

+0

あなたの答えをありがとう! しかし、お客様の90%が最初の訪問時に製品を購入し、まもなく復帰しません。新しい訪問者のための準備モデルを作ることはできません。そして、彼らは推薦エンジンのためにitemCFを使用することを好む。今は不可能な使命のように聞こえる... – DataHolic

関連する問題