AIME (American Invitational Mathematics Examination)
▼ ざっくり言うと
アメリカの高校数学コンテスト、LLMの数学力ベンチマークとしても使われます。
▼ もうちょっと詳しく
本来は全米高校生向けの数学コンテストで、上位だけが数学オリンピック予選に進めるレベルの難問15題。LLMの「ちゃんと考える力」を測る指標として近年よく使われます。
単なる暗記では解けず、多段階の推論が必要な問題が並ぶので、推論モデル(o1, o3, Claude の extended thinking など)の評価で重宝されます。人間の高校生の上位陣でも全問正解はキツいやつです。
AIが高校数学の難問を当たり前に解く時代、なかなか凄まじいです。
あなたの読了: 0 / 388 語

