2017-06-02 13 views
4

機械翻訳のBLUEスコア計算に関する質問があります。私は彼らがBLEUとは異なる測定基準を持っているかもしれないことに気付きました。私はこのコードがBLEUの5つの値、すなわちBLEU-1、BLEU-2、BLEU-3、BLEU-4、そして最後にBLEUを報告していることを発見しました。これは前の4つのBLEUの指数平均です。それでもそれらの違いが何であるかはわかりません。あなたはなにか考えはありますか?おかげでBLEUスコアのバリエーション

p.s.最初は私はこのquestionが理論的な内容であると思って、それをmeta stackexangeに投稿しました。モデレータがクローズし、スタックオーバーフロー型の質問としてコメントしました。だからもう一度私を罰せないでください。 =)

答えて

2

源:私は私はそれが意味推測BLEU-1及びBLEU-2を聞いたことがないhttp://www.statmt.org/book/slides/08-evaluation.pdf

1グラム、2グラム、3グラムの式4グラムBLEUのスコアは、あなたの質問の式precision[i] = BLEU-iを意味します:
enter image description here

関連する問題