機械学習アルゴリズムを使用すると、2つの混乱があります。最初は、私はそれを使っていると言わなければなりません。機械学習のいくつかの混乱
二つのカテゴリーAとBがありますが、私は彼らの混合物からできるだけ多くを選択したい場合は、アルゴリズムのどのような私は(サンプル数を考慮する必要)を使用するべきではありません。最初は分類アルゴリズムでなければならないと思いました。そして、たとえばTMVAパッケージで意思決定ツリーを強化していますが、誰かがBDTが回帰アルゴリズムであると私に言いました。
私は粗いデータを持っています。私がそれをBDTに投げ込む前に分析すると(いくつかの組み合わせをすると...)、粗いデータをBDTに投げるよりも良い結果が得られます。粗いデータにはすべての情報が含まれているので、なぜ自分で分析する必要がありますか?
あなたは明確ではないですか?コメントを追加してください。あなたに私に助言を与えることができれば幸いです。
を使用する必要がありますか?また、クラシファイアで使用したパラメータ(例:n_classifier、max_depthなど) – maxymoo
自分のデータはいくつかのパーティクルです。パーティクルには、px、py、pz、eという運動量があり、x方向の運動量、yの方向、エネルギーを意味します。これは粗いデータです。異なるカテゴリーAおよびBについて、AおよびBの質量は異なる。したがって、その質量= sqrt(e^2-px^2-py^2-pz^2)を組み合わせることができます。また、cos = pz/sqrt(px^2 + py^2 + pz^2)のような他の意味のある変数を組み合わせるために、4つのモーメンタム(粗いデータ)を使用することもできます。ご覧のように、すべての「分析されたデータ」は「粗いデータ」の組み合わせですが、「分析されたデータ」はBDTのより良い入力です。 – insomnia
"!H:!V:NTrees = 850:MinNodeSize = 2.5%:MaxDepth = 5:BoostType = AdaBoost:AdaBoostBeta = 0.5:UseBaggedBoost:BaggedSampleFraction = 0.5:SeparationType = GiniIndex:nCuts = 20" BDTの場合。 – insomnia