コンテキスト圧縮 (Contextual Compression)
▼ ざっくり言うと
RAGで取り出した資料を「質問に関係する部分だけ」に圧縮する技です。
▼ もうちょっと詳しく
RAGで資料を取ってきたとき、長い文書をそのままLLMに渡すとトークンを食いすぎるし、ノイズも増える。そこで、「質問に関係しそうな段落・センテンスだけを抜き出す」前処理を挟むのがコンテキスト圧縮です。
実装にはLLMをもう一段使うことが多く、「いまの質問にとって本当に必要な情報か?」を別のAIに判定させる、という鏡の合わせ技。料金と精度のトレードオフを細かく調整する地味な工夫です。
AIに「要点だけ言って」と頼む工程を、もう一つAIに任せる、というのが構図です。
あなたの読了: 0 / 390 語

