ARC-AGI (ARC-AGI)
▼ ざっくり言うと
「本当の知能」に近いかを測ろうとしている、いまもAIが苦戦中のベンチマークです。
▼ もうちょっと詳しく
フランソワ・ショレが設計した抽象推論テスト。色とりどりのマス目パターンを見せて、ルールを推測して別のパターンを完成させる、というクイズです。人間なら子供でもできるレベルですが、LLMにとっては難問。
2024年ごろまでLLMの正答率は数%〜数十%、人間は80-90%、という構図が長く続きました。が、推論モデル(o3など)が登場して、人間並みに近づき始めています。「AIはまだまだ」と「AIは人間に追いついた」のあいだに揺れる、業界のバロメータです。
名前を見るたびに「AGIまで本当に近いの?」と業界が真顔になります。
あなたの読了: 0 / 390 語

