ARC-AGIアークエージーアイ (ARC-AGI)

▼ ざっくり言うと

「本当の知能」に近いかを測ろうとしている、いまもAIが苦戦中のベンチマークです。

▼ もうちょっと詳しく

フランソワ・ショレが設計した抽象推論テスト。色とりどりのマス目パターンを見せて、ルールを推測して別のパターンを完成させる、というクイズです。人間なら子供でもできるレベルですが、LLMにとっては難問

2024年ごろまでLLMの正答率は数%〜数十%、人間は80-90%、という構図が長く続きました。が、推論モデル(o3など)が登場して、人間並みに近づき始めています。「AIはまだまだ」と「AIは人間に追いついた」のあいだに揺れる、業界のバロメータです。

名前を見るたびに「AGIまで本当に近いの?」と業界が真顔になります。

あなたの読了: 0 / 390