DoRAドーラ (Weight-Decomposed Low-Rank Adaptation)

▼ ざっくり言うと

LoRAの精度をさらに上げた、重み分解型のファインチューニング技法です。

▼ もうちょっと詳しく

2024年にNVIDIAらが発表。LoRAは重みを低ランクで近似するだけでしたが、DoRAは重みを『方向』と『大きさ』に分解して、それぞれを別々に学習します。これで、LoRAより精度が高く、フルファインチューニングに近い結果が出る、と報告されています。

計算量はLoRAとほぼ同じなので、「同じコストで精度アップ」という美味しい改良。LLM・拡散モデル両方で使われ始めている新しい標準候補です。

数字を「方向と大きさ」に分解すると賢くなる、というのは、数学的に妙に納得感があります。

あなたの読了: 0 / 388