4
機械翻訳のBLUEスコア計算に関する質問があります。私は彼らがBLEUとは異なる測定基準を持っているかもしれないことに気付きました。私はこのコードがBLEUの5つの値、すなわちBLEU-1、BLEU-2、BLEU-3、BLEU-4、そして最後にBLEUを報告していることを発見しました。これは前の4つのBLEUの指数平均です。それでもそれらの違いが何であるかはわかりません。あなたはなにか考えはありますか?おかげでBLEUスコアのバリエーション
p.s.最初は私はこのquestionが理論的な内容であると思って、それをmeta stackexangeに投稿しました。モデレータがクローズし、スタックオーバーフロー型の質問としてコメントしました。だからもう一度私を罰せないでください。 =)