私は隠れマルコフモデルを研究しているEMアルゴリズムには新しいです。EMを使ってHMMを訓練することについて
EMによる私のHMMのトレーニング中に、私はデータ設定について非常に混乱しています。 (テキスト処理)
私のEM使用が大丈夫かどうか確認してください。
最初は、私のトレーニングセット全体で排出確率マトリクスの統計を計算しました。そして、私は同じセットでEMを走らせました。 - >目に見えないデータの排出確率は、その時点でゼロに収束しました。
私はテキストとスピーチと言語処理を読んでいましたが、私は運動8.3が2相訓練方法を教えていることを発見しました。
8.3演習8で作成したHMMタグを拡張します。ラベル付きのトレーニングコーパスに加えてラベルのないデータを使用する機能を追加することによって、まず、ラベルのない大きなコーパスを取得します。次に、前方 - 後方トレーニングアルゴリズムを実装する。演習8のトレーニングコーパスで訓練したHMMパラメータから始めましょう。このモデルをM0と呼ぶ。これらのHMMパラメータを用いて前方 - 後方アルゴリズムを実行し、監視されていないコーパスにラベルを付ける。新しいモデルM1が完成しました。保留中のラベル付きデータに対して、M1の性能をテストします。
このステートメントに続いて、トレーニングセット(トレーニングセットの1/3)からいくつかのインスタンスを選択して初期統計情報を取得します。 次に、EMのパラメータを最適化するためにトレーニング全体を設定したEMプロシージャを実行します。
大丈夫ですか?
ありがとうございます。あなたのコメントは一般的なHMMの訓練手続きか、または自己訓練についてのみですか? –
セルフトレーニング。訓練は、この手順のサブルーチンとして考えることができます。 – Aaron
ありがとうございます!あなたのコメントは私の質問を解決する良い方向になることができます。 –