アテンション (Attention)
▼ ざっくり言うと
文章のどこに注目するかを決める仕組みです。
▼ もうちょっと詳しく
「彼は鈴木さんに本を渡した。彼女はそれを喜んだ。」という文があったとき、「彼女」が誰のことか、「それ」が何のことかを判断するには、文中のいろんな単語を見比べる必要があります。アテンションは、その「見比べ」を数値計算でやる仕組みです。
要するにいろんな単語をチラチラ見ながら、関係の深いやつに重みをつける装置。学級会で「で、これに関係しそうな人は誰だっけ」と先生が考える、あの作業を機械でやらせていると思ってください。
▼ ちょっとだけ深い話
論文タイトルが「Attention Is All You Need(必要なのはアテンションだけ)」というやたらキャッチーなやつで、2017年に発表されました。これがその後のLLM大ブームの土台になっています。タイトル勝ちの好例です。
名前の通り「注目」の意味ですが、AIに使われるとなぜか急にエラそうに見えます。
あなたの読了: 0 / 388 語

