hmmlearnを使って英語のテキストを分類するには？

古典的なマルコフモデルの問題を実装したい：英語のテキストパターンを学習するためにMMを訓練し、それを使って英語テキストとランダムな文字列を検出する。hmmlearnを使って英語のテキストを分類するには？

私はhmmlearnを使用することに決めました。私は自分自身を書く必要はありません。しかし、私はそれを訓練する方法について混乱しています。それは、HMMのコンポーネントの数を必要とするようですが、英語のための妥当な数字は何ですか？また、隠されているのではなく、単純な高次マルコフモデルを実行することはできますか？恐らく興味深いのは、隠れた状態ではなく、ngramのパターンです。

出典

2017-04-03 Superbest

hmmlearnは、HMMの教師なし学習用に設計されていますが、問題は明確に管理されています。英語とランダムな文字列の例を挙げて、2つを区別する方法を学びます。また、あなたが正しく指摘したように、隠れた状態の概念はテキストデータを定義するのが難しいので、問題のためにプレーンなMMが適切でしょう。私はあなたがそれらを<のPythonで100行のコードに実装できるはずだと思います。

出典

2017-04-11 20:25:30

hmmlearnを使って英語のテキストを分類するには？

答えて

関連する問題