拡散モデルカクサンモデル (Diffusion Model)

▼ ざっくり言うと

ノイズから少しずつ画像を浮かび上がらせるタイプの生成AIです。

▼ もうちょっと詳しく

ザラザラのノイズ画像から始めて、「もう少しノイズを取ったら何が見えるかな?」を何回も繰り返して、最終的にきれいな画像にしていく仕組みです。砂嵐から絵が浮かび上がってくる、ホラーみたいな処理を逆向きに使ってる、と思ってください。

Stable Diffusion、DALL-E、Midjourney など、最近の画像生成AIはだいたいこの仕組み(拡散モデル)を使っています。だから「Diffusion」という単語があちこちで出てくる、と覚えておくと話が早いです。

▼ ちょっとだけ深い話

拡散モデルが台頭する前は、GAN(敵対的生成ネットワーク)が画像生成の主役でした。世代交代があった、と覚えておくと歴史っぽくなります。

ノイズから絵が出てくる仕組み、と聞くと魔法ですが、計算式を見ると一気に冷めます。

あなたの読了: 0 / 388