BLEU (BLEU)
▼ ざっくり言うと
機械翻訳の出力を「お手本訳とどれくらい似てるか」で点数化する古典的指標です。
▼ もうちょっと詳しく
2002年にIBMが提案。機械翻訳の出力とお手本となる人間翻訳を比べて、単語のかぶり方を点数にします。0〜1(または0〜100)の値で、高いほど良い、というシンプルな指標。
20年以上、機械翻訳論文の必須項目でした。が、「単語が一致してても意味がズレてたら意味がない」という弱点もあり、最近はLLM時代になって人間評価やLLM評価に主役を譲りつつあります。長年のお疲れさま枠。
フランス語で「青」のBLEUですが、関係はありません。命名は単なる略語です。
あなたの読了: 0 / 388 語

