BatchNorm (Batch Normalization)
▼ ざっくり言うと
各層の出力を「ミニバッチごとに正規化する」、学習を安定させる工夫です。
▼ もうちょっと詳しく
2015年に発表されたディープラーニングの画期的な技。各層の出力をミニバッチ単位で平均0・分散1に揃えることで、学習が劇的に安定し、深いネットワークも問題なく学習できるようになりました。
現代のCNNではほぼ全部に入っている標準装備。ただし、LLM・Transformer 系ではLayerNormの方がよく使われます(バッチサイズに依存しないので)。用途で住み分けている仲間関係。
「数字を揃えるだけ」で結果が劇的に良くなる、というのは何度味わっても不思議です。
あなたの読了: 0 / 388 語

