2012-08-29 12 views
31

人工知能の方法では、2段階のトレーニングがあります。 これらの段階はデータとテストです。Giza ++でTrain and Testの手順を実行するにはどうすればよいですか?

トレーニング段階では、大量のデータをシステムに渡します。通常、データの量を少なくしてテストします。次に、出力を評価します。

このトレーニングは、GIZA ++に組み込まれている組み込み機能を使用して行うことができますか、それとも別のアプリケーションを作成する必要がありますか?

別のアプリケーションを作成する必要がある場合は、既に書いたアプリケーションを提案することで誰でも助けてくれますか?またはマニュアル? 注:アライメントプログラムを統計的機械翻訳ではなく、

私は観察できないデータでテストできるようにギザ++でトレーニングしたいと思います。

ありがとうございます。

+0

あなたはモデルを訓練するためのデータセットを探したいだけですか?既存のアライメントデータセットを使用しないのはなぜですか? – Daniel

+3

参照: http://stackoverflow.com/questions/5752043/is-there-a-tutorial-about-giza – Daniel

答えて

1

これは、Mosesを使用してベースラインmtシステムをトレーニングするのに適した出発点です。
通常、GIZA ++は、あなたの並列コーパスの単語の整列に使用されます。
言語モデルの推定には、IRSTLM、SRILM、KenLMなどの他のツールが必要です。