推論遅延 (Latency)
▼ ざっくり言うと
AIに質問してから答えが返ってくるまでの待ち時間のことです。
▼ もうちょっと詳しく
ChatGPTやClaudeにお願いを投げたあと、「うーん…」と少し待たされる時間です。これがレイテンシ(推論遅延)。裏で大量の計算をやっているので、ゼロにはなりません。
近年は推論モデル(考えてから答えるやつ)も登場し、長考タイプのモデルでは1分以上待たされることもあります。「便利だけど、待つ」のがAI時代の新しい辛抱です。
▼ 気をつけること
ストリーミングで答えを少しずつ表示するのは、レイテンシ対策の心理戦のひとつです。実時間は同じでも、何か始まったほうが体感が良い、という人間の弱点を突いた工夫。
待ち時間が長くなるたびに、AIに「忙しいの?」と聞きたくなる人が多いです。
あなたの読了: 0 / 388 語

