勾配爆発問題 (Exploding Gradient Problem)
▼ ざっくり言うと
勾配が学習中にどんどん巨大化して、モデルが発散してしまう現象です。
▼ もうちょっと詳しく
勾配消失とは逆に、勾配がどんどん大きくなり、最終的に値が無限大に近づいてモデルが崩壊する現象です。RNNなどでよく起きました。
対策は勾配クリッピング(値が大きすぎたら切り捨てる、というシンプルな手口)、学習率の調整、バッチノームなど。「制御不能になる前に首根っこを掴む」という地味な工夫が効きます。
「制御不能になる前に切る」というのは、AIにも人間にも有効な処世術です。
あなたの読了: 0 / 388 語

