エンベディング (Embedding)

▼ ざっくり言うと

言葉や画像を「数字の並び」に変換することです。

▼ もうちょっと詳しく

AIは言葉そのままだと扱えません。なので「猫」を [0.21, -0.34, 0.88, ...] みたいな数字の列に変換します。これがエンベディング(埋め込み)です。日本語訳もそのまま「埋め込み」。なんで埋め込みなのかは深く考えないでください。

数字に変換するメリットは、「近い意味の言葉は、近い数字になる」ように設計できることです。「猫」と「犬」は近くて、「猫」と「机」は遠い、みたいな空間に押し込まれます。これによって、AIが「似てる/似てない」を計算できるようになる、というのが肝です。

▼ ちょっとだけ深い話

RAG(検索しながら答えるやつ)では、「質問」と「資料」をそれぞれエンベディングにして、近いものを引っ張ってくる、という使い方をします。検索エンジンの裏側で、こいつがめちゃくちゃ働いています

日本語名「埋め込み」は何かを地面に埋める感じがしますが、実際は数字の海に放り込むイメージです。

あなたの読了: 0 / 388