boosting

    1

    1答えて

    大規模データセット(〜1M行、500列)でcatboostを実行すると、 トレーニングが停止しました(反復回数0の解、おそらく小さすぎる12正則化、それを増やしてみてください)。 L2正規化値はどのようになるはずですか?それは、yの平均値、変数の数、ツリーの深さに関連していますか? ありがとうございます!

    1

    1答えて

    グラディエントブーストを実装するためにgbm関数を使用しました。そして私は分類したいと思います。 その後、グラジエントブーストモデルで変数の重要度を表示するためにvarImp()関数を使用しました。 しかし、4つの変数だけが重要度ゼロではありません。私の大きなデータには371の変数があります....それは正しいですか? これは私のコードと結果です。 >asd<-read.csv("bigdataf

    1

    1答えて

    gbm()関数を使用してモデルを作成しましたが、精度を求めています。ここに私のコードです: df<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE) str(df) F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21) for(i in F)

    0

    1答えて

    私は弾性検索が初めてです。ドキュメント内のフィールドのブースト値の較正とスケーリングを理解できません。どのようにしてフィールドのブースティング値を決定して、それが期待どおりに動作するようにする必要があります。私はいくつかのオンラインブログとesのドキュメントを見てきました。それは、正規化と内部最適化を行って値を上げることを書かれていますか?それはどのように機能するのですか? 例:Googleドキュ

    0

    1答えて

    私はRでC50パッケージを使用しており、生産のためのモデルをエクスポートする必要があります。 私はboostingオプションを使用していますが、試行は重み付けされていますが、出力には重みが指定されていません。 私はミス分類にウェイトオプションを使用していません。試行の重みが必要です。 Rを通して私のc50モデルの各試行の重量を知る方法はありますか?変数が使用されているすべての変数の

    1

    2答えて

    Rのgbmパッケージを使用して分類ツリーを強化しようとしていますが、predict関数から得られる予測の種類について少し混乱しています。 #Load packages, set random seed library(gbm) set.seed(1) #Generate random data N<-1000 x<-rnorm(N) y

    2

    1答えて

    列車パッケージメソッド= C5.0を使用しています。最終的なモデルがツリーとしてプロットされています。 結果ツリーが定義されています使用 plot(diabetes.c50$finalModel,trials=15) Error in plot(diabetes.c50$finalModel, trials = 15) : object 'diabetes.c50' not found

    0

    1答えて

    モデルCatBoostRegressor()のトレーニング中に、勾配ステップ係数である '学習率'パラメータを変更(減少)する可能性はありますか?反復数を減らしてトレーニングを早めるでしょうか?

    0

    1答えて

    私はthe tree.export_graphviz functionで画像にGBDTの構造をエクスポートすることができます。 を `` `のpython3 from sklearn.datasets import load_iris from sklearn import tree from sklearn.ensemble import GradientBoostingClassifier

    0

    1答えて

    私はElasticsearch 2.4.3を使用していますが、クエリの特定のフィールドを強調したいとします。これは可能ですか?私はインデックスをどのように高めることができるのか分かります。 おはようございます! UPDATE マッピング: "firstName":{"type":"string", "analyzer":"customNGram" }, "lastName":{