BatchNormバッチノーム (Batch Normalization)

▼ ざっくり言うと

各層の出力を「ミニバッチごとに正規化する」、学習を安定させる工夫です。

▼ もうちょっと詳しく

2015年に発表されたディープラーニングの画期的な技。各層の出力をミニバッチ単位で平均0・分散1に揃えることで、学習が劇的に安定し、深いネットワークも問題なく学習できるようになりました。

現代のCNNではほぼ全部に入っている標準装備。ただし、LLM・Transformer 系ではLayerNormの方がよく使われます(バッチサイズに依存しないので)。用途で住み分けている仲間関係。

「数字を揃えるだけ」で結果が劇的に良くなる、というのは何度味わっても不思議です。

あなたの読了: 0 / 388