BLEUブルー (BLEU)

▼ ざっくり言うと

機械翻訳の出力を「お手本訳とどれくらい似てるか」で点数化する古典的指標です。

▼ もうちょっと詳しく

2002年にIBMが提案。機械翻訳の出力とお手本となる人間翻訳を比べて、単語のかぶり方を点数にします。0〜1(または0〜100)の値で、高いほど良い、というシンプルな指標。

20年以上、機械翻訳論文の必須項目でした。が、「単語が一致してても意味がズレてたら意味がない」という弱点もあり、最近はLLM時代になって人間評価やLLM評価に主役を譲りつつあります。長年のお疲れさま枠

フランス語で「青」のBLEUですが、関係はありません。命名は単なる略語です。

あなたの読了: 0 / 388