U-Net (U-Net)
▼ ざっくり言うと
画像のどこに何があるかを画素単位で塗り分ける、セグメンテーションの定番アーキテクチャです。
▼ もうちょっと詳しく
ネットワークが横から見るとU字型になっているのが名前の由来。前半で画像をどんどん小さく圧縮し、後半でまた元の大きさに戻していきます。
ただ縮めて戻すだけだと細部が失われてしまうので、前半の各層と後半の同じ大きさの層を、スキップ接続で直接つなぐのがU-Netの肝。これで「全体の意味は深い層で見つつ、細かい位置情報は浅い層から拾う」という両取りができます。
▼ ちょっとだけ深い話
2015年に医療画像セグメンテーション用に発表されたのが最初。少ない学習データでも精度が出ることから、細胞の輪郭抽出・CT/MRI 解析・衛星画像などで一気に広まりました。
現代ではStable Diffusion をはじめとする拡散モデルの中核アーキテクチャとしても使われていて、出自を知らないで触っている人も多そうです。「画像のノイズを少しずつ取り除く」のもU-Netが得意な作業なので、自然な選択でした。
医療向けに作られたアーキテクチャが10年後に画像生成AIの主役になる、というのは、研究の世界の独特な巡り合わせです。
あなたの読了: 0 / 390 語

