エンベディング (Embedding)
▼ ざっくり言うと
言葉や画像を「数字の並び」に変換することです。
▼ もうちょっと詳しく
AIは言葉そのままだと扱えません。なので「猫」を [0.21, -0.34, 0.88, ...] みたいな数字の列に変換します。これがエンベディング(埋め込み)です。日本語訳もそのまま「埋め込み」。なんで埋め込みなのかは深く考えないでください。
数字に変換するメリットは、「近い意味の言葉は、近い数字になる」ように設計できることです。「猫」と「犬」は近くて、「猫」と「机」は遠い、みたいな空間に押し込まれます。これによって、AIが「似てる/似てない」を計算できるようになる、というのが肝です。
▼ ちょっとだけ深い話
RAG(検索しながら答えるやつ)では、「質問」と「資料」をそれぞれエンベディングにして、近いものを引っ張ってくる、という使い方をします。検索エンジンの裏側で、こいつがめちゃくちゃ働いています。
日本語名「埋め込み」は何かを地面に埋める感じがしますが、実際は数字の海に放り込むイメージです。
あなたの読了: 0 / 388 語

