2016-07-14 6 views
0

私はアルゴリズムの実装に精通していますが、機械学習には新しいですが、私は学問と生産の間にギャップがあります。機械学習モデルを既存のウェブサイトに導入する方法

私は推奨システムと学習モデルを実装しています。良い結果が得られたら、私は停止して、次に何をすべきか尋ねましたか?既存のウェブサイトでの展開方法

私はCSVデータセットとローカルマシンを使用しましたが、オンラインは数十万人のユーザーと数千人のユーザーを持つデータベースになります。だから私はすべてのデータをロードし、ユーザーに物事を推薦することは不可能だと思う。

質問: 私の訓練されたモデルをどのようにプロダクションで使用しますか?

答えて

-1

私は実際にあなたがここで何を意味するかは分かりません。通常は、トレーニングデータを使用してモデルをトレーニングします。次に、特定のテストデータセットを使用してモデルを検証します。モデルが約束の結果を示す場合(例えば、「訓練された」)、それは生産に向かう。

例としてショッピングのご紹介をご覧ください。以前の製品に基づいて次の製品を提案するモデルを訓練しました。今、プロダクションでは、顧客が新しい製品を購入/見た場合、この製品を使用してアルゴリズムを供給し、選択できる他の製品を提供します。これはトレーニング/検証データと同じです。

データソースは一般的には関係ありません。しかし、おそらく私は本当にあなたの質問を得ることはありません。あなたは詳しく説明できますか?

+0

私はモデルを訓練し、効率をチェックする方法を知っています。私の質問はリレーショナルデータベースを使って私のモデルを実装する方法ですか?私が類似の映画を推薦する前に、1つの映画を見た新しいユーザーにいくつかの映画を推薦すれば..どのようにこれらの類似点を測定するのですか?どのようにリレーショナルデータベースを使用してこれらのアプローチを実装する "mysql"と言うでしょう –

+1

どの言語であなたのモデルを書いていますか?そのためのmysqlコネクタが必要です([ここではpython](https://pypi.python.org/pypi/mysql-connector-python/2.0.4)を参照)。次に、データベースサーバーに接続し、必要なデータを取得してアルゴリズムに入力します。 – sQu4rks

+0

@AhmedSyam:おそらくリンクがあなたの質問に答えます。 [link](https://www.quora.com/What-is-the-easiest-way-to-deploy-a-machine-learning-model-say-a-regression-for-production) –

1

「何十万人のユーザーと何千ものユーザーがいるデータベース」と言いました。私は、あなたが何十万人ものユーザーと何千ものアイテムを意味していたと思います。 ユーザーの共同編集フィルタリングまたはアイテムアイテムフィルタリングがありますか?

もしそうなら、数字(10K * 1K)はまともなリレーショナルデータベースでは問題にならないでしょう。 基本的にテーブルを作成して、 "Rattings"と言うと、UserId、ItemId、Rattingを保存します(あなたの "機能"が購入したかどうかのバイナリです)。

ユーザアイテムマトリックスがスパースである場合、このテーブルは小さくなります。 また、 "Rattings"テーブルに挿入した後、必要な予測やその他のデータを正規化する必要がある場合は、ユーザーの平均ラッティングなどを事前計算できる「Users」テーブルを作成します。経験則として、挿入するときに他のテーブルをスキャンするという非常に複雑な計算を行うのではなく、予測/推奨事項を計算するためにデータを取得するときに他のテーブルで複雑なスキャンを行わないようにすると簡単な計算ができます。

ここからいくつかのアイデアを得ることができる:http://lemire.me/fr/documents/publications/webpaper.pdf

は、リレーショナルDbがストレージであることを考慮してください、でもそれは、SQLを使用して、ほとんどすべてのものを計算することができ、通常のシナリオでは、フィルタリングのためのリレーショナルDBを使用して接合されており、他の層/トライヤーで数学を行う。