2017-04-03 18 views
0

トレーニングデータを使用してモデルを構築し、最終的に要件に合わせてデータをテストするときは、ML世界で初めてです。モデルは準備ができています訓練された機械学習モデルをプロダクションに展開する手順

  1. 実動展開後にモデルをトレーニング/再トレーニングする必要はありますか?もしそうなら、練習は何ですか?
  2. 仮説を維持する方法があるので、モデルは永続化された結果を使用して予測できますか?
  3. モデルを毎日、週または月に再トレーニングするのがよい方法ですか?

と仮定すると、火花MLIBは

  • は私が詳細を追加してみましょうモデルを構築するために使用されます。私はモデルを訓練するときに、演習前の環境でスコアベースの列車データを生成するために、モデルを再トレーニングするのではなく、後で予測するためにスコア付きデータを分散ストレージに保存できますか?私はステップを理解したいです 1)私のテスト済みのモデルをプロダクション環境からプロダクション環境に移すとき、結果を予測したいトレーニングデータと新しいデータセットを用意する必要がありますか?

私は生産にモデルオブジェクトを展開する必要があることを意味している、私は明確化のため

感謝を考慮する必要がありますどのような手順、次の環境中に放出する方法モデルのコードを理解したいと思い、私は、機械学習に非常に新しいです生産データ(機能)を使用して目標データの価値を計算してください。私は、監督されたアルゴリズムを構築し、検証し、展開する方法を知ることができる書籍や情報を紹介してください。

もう一度、教えていただきありがとうございます。

+0

「ML」タグは、機械学習ではなくプログラミング言語ML用です。 – molbdnilo

答えて

0

プロダクションデプロイメント後にモデルをトレーニング/再トレーニングする必要はありますか?もしそうなら、練習は何ですか?

必ずしもそうではありません。多くは、 がモデル化されていることと、それがどれほど安定しているかによって異なります。

仮説を維持する方法があるので、モデルは永続化された結果を使用して予測できますか?

  • ??私は質問を理解しているか分からないが、ほとんどの生産モデルには、分析/報告/仮想化に添付されたログシステムが付属している は、モデルのパフォーマンスを追跡し、それは、毎日または週または月のモデルを再訓練することをお勧めし

ですか?

  • 種類は、パフォーマンスとリソースの制約によって決まります。再訓練/スコアリングを行い、再訓練するモデルの数が少ない場合は、SLAに影響しませんが、それはおそらく悪い考えではありませんが、 制限されたコンピューティングリソースがある場合、答えが変わる可能性があります。
+0

仮説を維持する方法があるので、モデルは永続化された結果を使用して予測できますか? - 詳細を追加してください。 – Appala

+0

私はまだあなたが何をしようとしているのか不明です。通常、モデルを本番環境に投入するときには、トレーニングデータを使用せず、モデルデータ(トレーニングプロセス中に作成される)とスコアリングする新しいデータ(ターゲットデータを引いたトレーニングデータとほとんど同じに見えます)を使用します。 – screechOwl

関連する問題