MoEエムオーイー (Mixture of Experts)

▼ ざっくり言うと

「専門家ネットワークを必要なものだけ動かす」効率化テクのことです。

▼ もうちょっと詳しく

モデル全体をいくつかの専門家ネットワーク(エキスパート)に分けておいて、入力ごとに「これは数学の質問だから数学エキスパートを呼ぶ」「これは料理の話だから料理エキスパートを呼ぶ」みたいに、必要なやつだけ動かす仕組みです。

全エキスパートを毎回動かすよりずっと安く・速く動かせます。Mixtral、DeepSeek、GPT-4(噂)、Grokなど、いまの主要LLMは何らかの形でMoEを採用していると言われています。大病院の専門医チーム制と思ってください。総合医より効率がいい。

▼ ちょっとだけ深い話

全体のパラメータは多いが、毎回動くのは一部だけ」という性質のおかげで、見かけサイズと実コストにギャップが出るのが特徴です。カタログスペックを鵜呑みにできないやつ。

社内で「呼ばれた専門家だけ会議に出る」運用、人間社会でももっと普及してほしいです。

あなたの読了: 0 / 390