合成データ (Synthetic Data)
▼ ざっくり言うと
AI自身や他の手段で「人工的に作り出した」学習データのことです。
▼ もうちょっと詳しく
本物のデータが足りない、または取れない場合、AIで作ったそれっぽいデータで学習を補う、という手法。プライバシー的に集めにくい医療データ、レアな故障パターン、特定の少数言語のテキストなどで活躍。
ただし、AIが作ったデータでAIを学習すると「モデル崩壊」が起きるリスクもあり、さじ加減が肝。「鏡同士で映し合う」みたいな構図で、深追いすると変なところに行く、というのが業界の警句です。
本物が足りないからニセモノを混ぜる、というのは料理にもよくある工夫です。
あなたの読了: 0 / 390 語

