リランキング (Re-ranking)

▼ ざっくり言うと

RAGの検索結果を、もう一段別のモデルで並び替える後処理です。

▼ もうちょっと詳しく

最初の検索(ベクトル検索など)で上位100件くらいの候補をざっと集めて、その中からより高精度な小さなモデル(再ランキングモデル)で「本当に質問に合うのはこの上位10件」と並び替える、という二段構えのRAG構成。

粗く取って、細かく絞る。Cohere、Voyage AI、Mixedbread あたりが reranking モデルを提供していて、RAG精度を上げる定石として広まっています。

「最初に粗くやって、後で細かく」というのは、料理にも仕事にも応用できそうです。

あなたの読了: 0 / 388