2017-07-16 11 views
0

私はアナリティクスが初めてで、モデルを生産するさまざまな方法を検討しています。線形回帰について言えば、y = mx + cという式を入力データに使うことができ、それをR/SAS/Pythonから取り出して、データベースのいずれでも使用することができます...XGブースト/デシジョンツリー/ランダムフォレストモデルをどのように製造するか

私がR/SAS/Pythonフレームワークの外に入ってくるデータでそれを生産したいのであれば、XG boost/Decison tree/Random forestで動作しますか?どこから独立変数のパラメータを得ることができますか?

どこから実装するのですか?

ありがとう

答えて

1

デシジョンツリーは、3つの中で最も簡単です。 GBは本質的に適応性があります。複雑に見えるが、採点コードは複雑ではない。 RFは最も厄介なものです。なぜなら、それほど複雑なRFモデルでは何百万行ものif-thenを持つことができるからです。ちょうどオーバーヘッドが殺害です。

回帰モデルとは異なり、3つのいずれもパラメータを持たないことが必要です。それらはすべて本質的にTREEです。 R、P、またはSの外で実行する必要がある場合は、APIのルートを検討してください。私は人がXMLでRFを非常に高速に解析するのを見てきました。納品要件に応じて、マイクロサービスに進む必要がある場合としない場合があります。お役に立てれば。

+0

あなたは、間違いや誤解で未回答の質問を受け取り、有用なアドバイスをいくつか行っています。 Answersが行っているように、それはかなり簡潔で自由ですが、これは少なくとも部分的に質問のギャップを反映しています。あなたはいくつかの進歩のために私の+1を得る。理想的には、OPは説明を求め(プロセスの質問にいくつかを作って)、将来の読者のために回答を改善するでしょう。 – hardmath

関連する問題