私は分類のためにエクスプローラ機能を使用しています。私の.arffデータファイルには、数値とバイナリの10個の機能があります。 (インスタンスのIDだけが公称です)。私は16のインスタンスを持っています。予測するクラスはYes/Noです。Naive Bayesを使用していますが、結果を解釈できません。ベイビスの分類結果の解釈方法を知っていますか?Wekaマシン学習:どのようにNaive Bayesクラシファイアをインタープレットするのですか?
答えて
Naive Bayesは重要な機能を選択しません。あなたが言及したように、Naive Bayes分類子の訓練の結果は、すべての特徴の平均と分散である。新しいサンプルを「はい」または「いいえ」に分類するのは、サンプルのフィーチャの値が、「はい」または「いいえ」のいずれかの訓練されたフィーチャの平均および分散と最もよく一致するかどうかに基づいています。
他のアルゴリズムを使用して最も有益な属性を見つけることができます。その場合、デシジョンツリークラシファイアを使用することができます。 WE40のJ48(これはオープンソースの実装であるC4.5 decision tree algorithmです)。結果の決定木の最初のノードは、どの機能が最も予測能力があるかを示します。
(他の投稿のRushdi Shamsの記載のとおり)さらに優れています。 Wekaのエクスプローラは、データセット内で最も有用な属性を見つける目的の構築オプションを提供します。これらのオプションはSelect attributes
タブにあります。
あなたは正しいです。私はちょうどWekaの意思決定木の分類子を使用し、それは私にとって重要な特徴を選択しました。手伝ってくれてどうもありがとう。 – Armand
シッコとしてNBはあなたに最高の機能を提供することはできません。意思決定ツリーは良い選択です。なぜなら、ブランチングで重要な機能を教えてくれることがあるからですが、常にそうではありません。シンプルから複雑なフィーチャセットを処理するために、WEKAのSELECT ATTRIBUTEタブを使用できます。そこで、検索方法と属性評価ツールを見つけることができます。あなたの仕事に応じて、あなたに最も適したものを選ぶことができます。彼らはあなたに機能のランキングを提供します(トレーニングデータから、またはk倍のクロスバリデーションから)。個人的には、あなたのデータセットがオーバーフィットしていると意思決定ツリーが悪いと思う。その場合、機能のランク付けは、最良の機能を選択するための標準的な方法です。ほとんどの場合、私は情報とランクのアルゴリズムを使用します。あなたの属性が1からkまでランク付けされているのを見たら、必要な機能と不要な機能を理解することは本当にうれしいです。
- 1. Naive Bayesクラシファイアによるオンライン学習
- 2. 機械学習PythonのNaive Bayesクラシファイア
- 3. n-gram(movie_reviews)のNaive Bayesクラシファイアの学習方法
- 4. niveのNaive Bayesクラシファイア
- 5. Python NLTK Naive Bayesクラシファイア
- 6. n-gramとNaive Bayesクラシファイア
- 7. SciKit-learn - Gaussian Naive Bayesクラシファイアをトレーニングする
- 8. naive bayesクラシファイアのトレーニングデータの選択方法
- 9. Apache Mahoutの重み付きNaive Bayesクラシファイア
- 10. スパーク1.6.1 python 3.5.1建物naive bayesクラシファイア
- 11. Naive Bayes(Python、scikit)のスパース行列/オンライン学習の使用
- 12. Pythonで多項式Naive Bayesクラシファイアを分類する例
- 13. テキストをオブジェクトjavascriptで分類するnaive bayesクラシファイア
- 14. Multinomial Naive Bayesクラシファイアに機能を追加する - Python
- 15. naive bayesクラシファイアはテキスト注釈を実行しますか?
- 16. NLTK PythonのNaive Bayesクラシファイアでのドキュメント長の使用
- 17. Naive Bayesの訓練されたクラシファイアをNLTKに保存
- 18. Naive BayesクラシファイアをSSASで実装する方法を学習するための最良のリソースは何ですか?
- 19. Naive Bayesクラシファイアでopen()文を使用すると長時間かかる
- 20. Pythonを使用したNaive Bayesクラシファイアの実行時間
- 21. textblob naive bayesクラシファイアのトピック分類時間を短縮する方法
- 22. Naive Bayesの問題
- 23. Naive Bayesクラシファイド数学 - コンピューティングにおける精度の欠如
- 24. Naive Bayes in Ruby
- 25. Naive Bayes Confusion;
- 26. Naive Bayes回帰
- 27. Mahout - Naive Bayes
- 28. ベースラインNaive Bayes、Multinomial Naive BayesおよびSemi-supervised NBを組み合わせることはできますか?
- 29. Pythonマシンの学習エラー...どのように解決するには?
- 30. sklearn Gaussian Naive Bayes - なぜ「ガウス」ですか?
多くの解釈が可能です。私の精度であるように、出力から得たいものについて具体的にしてください。 –
実際に私は意思決定(YEs/No)につながる重要な機能を見たいと思っています。しかし、NBが与えるすべてのものは、確率、平均、stddvなどです。さらに、すべての機能についてです。それは私の問題です。私は今、あなたが私を理解してくれることを願っています...しかし、正確さとリコールはどのような情報を私に与えますか? – Armand