ソフトマックス関数 (Softmax Function)
▼ ざっくり言うと
数字の並びを「合計1の確率」に変換する関数です。
▼ もうちょっと詳しく
モデルの出力が [2.5, 1.2, 0.3] みたいな生の数字のとき、これを「合計100%の確率分布」に変えてくれるのがソフトマックス関数です。[0.72, 0.21, 0.07] みたいに。
分類タスクの最後の層、LLMが「次のトークン」を選ぶ仕組みなど、現代のニューラルネットの出口にだいたい立っている地味で重要な関数。「合計を1にする」というだけの仕事で、こんなに使われるとは関数本人も思ってなかったでしょう。
「合計を100%にする」と聞くと簡単そうですが、地味に効くやつです。
あなたの読了: 0 / 390 語

