U-Netユーネット (U-Net)

▼ ざっくり言うと

画像のどこに何があるかを画素単位で塗り分ける、セグメンテーションの定番アーキテクチャです。

▼ もうちょっと詳しく

ネットワークが横から見るとU字型になっているのが名前の由来。前半で画像をどんどん小さく圧縮し、後半でまた元の大きさに戻していきます。

ただ縮めて戻すだけだと細部が失われてしまうので、前半の各層と後半の同じ大きさの層を、スキップ接続で直接つなぐのがU-Netの肝。これで「全体の意味は深い層で見つつ、細かい位置情報は浅い層から拾う」という両取りができます。

▼ ちょっとだけ深い話

2015年に医療画像セグメンテーション用に発表されたのが最初。少ない学習データでも精度が出ることから、細胞の輪郭抽出・CT/MRI 解析・衛星画像などで一気に広まりました。

現代ではStable Diffusion をはじめとする拡散モデルの中核アーキテクチャとしても使われていて、出自を知らないで触っている人も多そうです。「画像のノイズを少しずつ取り除く」のもU-Netが得意な作業なので、自然な選択でした。

医療向けに作られたアーキテクチャが10年後に画像生成AIの主役になる、というのは、研究の世界の独特な巡り合わせです。

あなたの読了: 0 / 390