拡散モデル (Diffusion Model)
▼ ざっくり言うと
ノイズから少しずつ画像を浮かび上がらせるタイプの生成AIです。
▼ もうちょっと詳しく
ザラザラのノイズ画像から始めて、「もう少しノイズを取ったら何が見えるかな?」を何回も繰り返して、最終的にきれいな画像にしていく仕組みです。砂嵐から絵が浮かび上がってくる、ホラーみたいな処理を逆向きに使ってる、と思ってください。
Stable Diffusion、DALL-E、Midjourney など、最近の画像生成AIはだいたいこの仕組み(拡散モデル)を使っています。だから「Diffusion」という単語があちこちで出てくる、と覚えておくと話が早いです。
▼ ちょっとだけ深い話
拡散モデルが台頭する前は、GAN(敵対的生成ネットワーク)が画像生成の主役でした。世代交代があった、と覚えておくと歴史っぽくなります。
ノイズから絵が出てくる仕組み、と聞くと魔法ですが、計算式を見ると一気に冷めます。
あなたの読了: 0 / 388 語

