ランダムフォレストでバッグアウトエラーが発生しましたか? ランダムフォレストで適切な数のツリーを見つけるのに最適なパラメータですか?ランダムフォレストでバッグアウトエラーが発生しましたか?
答えて
私が説明しようとする試みがかかります。
は、私たちのトレーニングデータセットは、Tによって表されると仮定するデータセットは、M機能(または属性または変数)を持っていると仮定します。
T = {(X1,y1), (X2,y2), ... (Xn, yn)}
と
Xi is input vector {xi1, xi2, ... xiM}
yi is the label (or output or class).
RFの要約:
ランダムフォレストアルゴリズムは主に二つの方法に基づく分類である -
- ランダム部分空間Mを袋詰め民法。
は、我々は、我々は最初の(各データセットに対してn回)ランダムで置換Tのデータのリサンプリングから作成"same size as original"
のS
データセットを作成し、当社の森の中で木のS
番号を持つことにしたとします。これにより、{T1, T2, ... TS}
データセットになります。これらはそれぞれブートストラップデータセットと呼ばれます。 「置換え」により、すべてのデータセットTi
は重複データレコードを持つことができ、Tiは元のデータセットからいくつかのデータレコードを失う可能性があります。これはBootstrapping
と呼ばれます。 (en.wikipedia.org/wiki/Bootstrapping_(statistics))
バグは、ブートストラップを取得して各ブートストラップで学習したモデルを集約するプロセスです。
RFはS
ツリーを作成し、M
の任意のツリーを作成する機能のうち、m (=sqrt(M) or =floor(lnM+1))
ランダムサブフィーチャを使用します。これをランダム部分空間法といいます。
したがって、Ti
ブートストラップデータセットごとに、ツリーを作成しますKi
。いくつかの入力データを分類する場合は、と表示される出力(各ツリーに1つ)を生成し、各ツリーを通過させるようにします。最終的な予測はこのセットに対する多数決です。
アウトオブバッグエラー:
オリジナルトレーニング各(Xi,yi)
ための分類器(S
木)を作成した後、すなわちT
、(Xi,yi)
を含まない全てTk
を選択設定します。このサブセットは注目に値するもので、元のデータセットの特定のレコードを含まない一連のブーストラップデータセットです。このセットは、バッグ外の例と呼ばれます。 n
のサブセット(元のデータセットTの各データレコードに1つ)があります。OOB分類器は、Tk
を超える票のみの集計であり、(xi,yi)
を含まない。
一般化エラーのアウトオブバッグ推定値は、トレーニングセットのアウトオブバッグ識別器のエラー率です(既知のyi
と比較してください)。
なぜ重要ですか? Breiman [1996b]のバッグド分類器の誤差推定の研究は、バッグ外推定値がトレーニングセットと同じサイズのテストセットを使用する精度と同じであることを示す経験的証拠を提供します。したがって、アウトオブバッグ誤差推定値を使用すると、セットアサイドテストセットの必要性がなくなる。
(訂正してくれてありがとう@Rudolfは。以下の彼のコメント。)
ランダムフォレストアルゴリズムのBreiman独自の実装では、各ツリーは、トレーニングデータの約2/3でトレーニングされます。フォレストが構築されると、ツリーを構築するのに使用されていないサンプルに対して、各ツリーをテストすることができます(相互検証と同様)。これは、袋外エラー推定値で、ランダムフォレストが構築されているときの内部エラー推定値です。
であなたの質問を投稿することができますいただきありがとうございます簡潔かつ明確な答え。 – ays0110
- 1. バリデーションスクリプトで問題が発生しました。エラーが発生しました。
- 2. ランダムフォレストがerr.rateを生成しない
- 3. SSRSサブスクリプションでエラーが発生しましたが、Report BuilberまたはReportServer WebUIでエラーが発生しました
- 4. エラーが発生しましたか?
- 5. ClassNotFoundExceptionエラーが発生しましたか?
- 6. スワップが発生しましたか?
- 7. ホームステイでエラーが発生したときにエラーが発生しました
- 8. UIAlertViewでエラーが発生しました。
- 9. フィボナッチシーケンスでエラーが発生しました
- 10. Excelでタイプミスマッチエラーが発生しました。
- 11. クイックソートプログラムでエラーが発生しました
- 12. System.Drawing.dllで 'System.ArgumentException'が発生しました
- 13. ActionPerformedでCloneNotSupportedExceptionが発生しました
- 14. Flumotionでエラーが発生しました
- 15. アクティビティでNullPointerExceptionが発生しました
- 16. BigDecimalでエラーが発生しました
- 17. argparseでエラーが発生しました
- 18. DNSでエラーが発生しました。
- 19. サービスでNullpointerExceptionが発生しました
- 20. バイナリコードでエラーが発生しました
- 21. アンドロイドスタジオでエラーが発生しました。
- 22. アンドロイドスタジオでコンテンツランタイムエラーが発生しました
- 23. xmlhttpresponseでエラーが発生しました
- 24. イオンライブリロードでエラーが発生しました
- 25. データバインディングでエラーが発生しました
- 26. クラウドコードでエラーが発生しました
- 27. cx_freezeでインポートエラーが発生しました
- 28. ハイブコマンドでエラーが発生しました
- 29. LINQでSystem.NullReferenceExceptionが発生しました
- 30. DateTimeFormatterでエラーが発生しました
この質問は、特定の実装ではない場合、あなたはhttp://stats.stackexchange.com/ – Sentry