テスト時計算 (Test-time Compute)
▼ ざっくり言うと
推論時に長く考えさせることで精度を上げる、最近の主流アプローチです。
▼ もうちょっと詳しく
従来のAI性能向上は「学習をいっぱいすれば賢くなる」という発想でした(=トレーニング時計算)。これに対し、テスト時計算は「答えるときに、AIに長く考えさせれば賢くなる」という発想。
OpenAI o1、o3、Claude の extended thinking などの推論モデルは、まさにこの思想の実装。お金と時間をかければ、頭の中の議論を増やせる、というシンプルな話だが、効果は劇的。スケーリング則の新しい次元として、2024年以降の主役の概念。
人間も「3秒待ってから答えて」と言われるとだいたいマシな答えを返します。同じです。
あなたの読了: 0 / 390 語

