リランキング (Re-ranking)
▼ ざっくり言うと
RAGの検索結果を、もう一段別のモデルで並び替える後処理です。
▼ もうちょっと詳しく
最初の検索(ベクトル検索など)で上位100件くらいの候補をざっと集めて、その中からより高精度な小さなモデル(再ランキングモデル)で「本当に質問に合うのはこの上位10件」と並び替える、という二段構えのRAG構成。
粗く取って、細かく絞る。Cohere、Voyage AI、Mixedbread あたりが reranking モデルを提供していて、RAG精度を上げる定石として広まっています。
「最初に粗くやって、後で細かく」というのは、料理にも仕事にも応用できそうです。
あなたの読了: 0 / 388 語

