私はプロジェクトに取り組んでいます。その一部はPOSタグ付けのための教師なしHMMトレーナーを開発することです。バウムウェルチアルゴリズムの実装をデバッグする(POSタグ付け用)
私は、Baum-Welchアルゴリズムを使用してモデルをトレーニングしています。入力は、(コーパスから引き出された)シーケンスワードであり、出力は、状態集合(s1, s2, ... sn)
からの隠れ状態のシーケンスである。 これでコードは完成しましたが、バグがないかどうかはわかりません。
誰でも私にデバッグのアイディアを教えてもらえますか?アウトプットをどのようにチェックすべきか?私のアルゴリズムの精度をチェックするには?
こんにちは、まずはあなたの答えと参照に感謝します 私はまだ評価段階ではありません。現在、私の懸念事項は私の実装技術の正確さです。これまでのNLPの問題の実装経験から、最小のバグが異なる出力につながる可能性があることがわかりました(私の悪いコーディングスタイルのためかもしれません)。この特定のケースでは、一致するサンプルチェックポイントはありません。ウォールストリートジャーナルコーパス(ラベル付きとラベルなし)&私の実験目標は、異なるパラメータ設定で監督されていないラベリングを学ぶことです。 – Irtiza
まず、多対1マッピングで60%の精度を達成しようとします。 – cyborg
ありがとう:) .. thats素晴らしいアイデア:) .. – Irtiza