HyDEハイド (Hypothetical Document Embeddings)

▼ ざっくり言うと

「もし答えがあったらこんな感じ」をAIに想像させてRAG精度を上げる技です。

▼ もうちょっと詳しく

RAGで「ユーザーの質問」と「資料」をエンベディングで比べるとき、質問が短すぎて検索精度が出ないことがあります。HyDEは、LLMにまず「もし答えがあったらこんな文章だろう」と仮の答えを書かせて、その仮答えで検索する、という賢い手口。

要するに仮免で先走って、それを使って本物を探す。期待される答えに似た文書のほうがヒットしやすい、という性質を逆手に取っています。ちょっとずるい手法ですが、効くことが多い。

「ハルシネーションを逆に利用する」という発想、業界の捻り具合がよく分かります。

あなたの読了: 0 / 390