NLPの最大可能性を理解しようとしています。 (9ページ)NLPでの最尤の理解
http://www.phontron.com/slides/nlp-programming-en-01-unigramlm.pdfと私はマニングとSchützeにより、統計的言語処理の基礎で同じ式を見た:私はこのpresntationを見ていました。
は今、私はそれがこの程度であるMLEを理解する方法:
私は実験の結果を知っているが、私は基本的な分布を知っているが、私は、単一のイベントの確率を知りません。 MLEは、私の観測から得られる可能性が最も高い確率の値を見つけることによって、確率(またはより一般的には未知のパラメータ)を見つけるのに役立ちます。
MLEでは、単一イベントの確率がxの場合、あるイベントを観測する可能性が最も高いことを示しています。
これが真実なら、なぜそのスライドに微積分が見えないのですか?なぜこのケースのMLEは単純な分数で計算されますか?これはMLEと何が関係しているのか分かりません。
私はMLEが最大化問題であると考えました...?
この質問は、おそらく交差検証されている必要があります。場合によっては、MLEは観測のいくつかの分数として表すことができます。あなたはそれを証明するために微積分を使うことができます。 –
数時間NLPを忘れてしまった。 MLEが行うことと、他のパラメータ推定手法と比較して、どこに位置するのかをより深く把握してみてください。これを見てください:https://engineering.purdue.edu/kak/Tutorials/Trinity.pdf – user3639557