データ汚染 (Data Poisoning)
▼ ざっくり言うと
学習データに変なものを意図的に混ぜてAIを狂わせる攻撃のことです。
▼ もうちょっと詳しく
AIが学習するデータの中に、悪意ある人がコッソリ変な例を仕込んでおく、というやり方の攻撃です。「この絵柄を全部『◯◯』と認識せよ」みたいなパターンを大量に紛れ込ませると、AIが本番でも変な判断をするようになります。
画家さんが「自分の絵をAIに学習させたくない」とき、わざと細工した画像を公開してAIをかく乱する、というツール(Nightshadeなど)も登場していて、攻防がじわじわ広がっています。
AIに「変な絵を覚えさせる」ことが対抗手段になる、という不思議な構図です。
あなたの読了: 0 / 390 語

