0

できるかどうか、そしてSGDを使用してMNBモデル​​をトレーニングすることが有効な方法であるかどうかを理解したいと思います。私のアプリケーションはテキスト分類です。 sklearn私は利用可能なMNBがないことを知りました。デフォルトではSVMですが、NBは線形モデルですね。だから、(ラプラススムージングと)私の尤度パラメータは MNB likelihood param estimation多項式Naive BayesでSGDを使用できますか?

のように推定することができる場合

私はSGDと私のパラメータを更新し、コスト関数を最小化することができますか?

enter image description here

SGDがここに無関係である場合は私に知らせてください。前もって感謝します。

UPDATE: 私は答えを得て、私はそれが正しいと思って、そのMNBのパラメータは、与えられた入力テキスト(tf-idfのような)の出現によって更新されます。しかし、MNBトレーニングにSGDを使用できない理由はまだ分かりません。明示的な説明や数学的な解釈で説明されていれば分かります。 sklearnのおかげで

+0

スレッド** CrossValidated ** – MMF

答えて

0

は、私は多項ナイーブベイズで実装されて

scikitは、学ぶ使用可能なMNBが存在しないことが判明しました。使用する勾配降下はありません。この実装は、単に、単一パス(MNBモデル​​に合わせて標準で最も効率的な方法)でモデルのパラメータを見つけるために、(スムージングして)相対頻度カウントを使用しています。

質問だろう

http://scikit-learn.org/stable/modules/naive_bayes.html

+0

ありがとうございます。 SGDがデフォルトでSVMを使用するSGDClassifierモジュールには、「利用可能なMNBはありません」という意味でした。そのため、SGDを使用して任意のモデルをトレーニングすることができると考えました。グラデーションを使用してコスト関数を最小化するためです。 – Novitoll

関連する問題