学習データ漏洩 (Training Data Leakage)
▼ ざっくり言うと
AIが学習中に覚えた個人情報や機密情報を、推論時にうっかり吐いてしまう現象です。
▼ もうちょっと詳しく
LLMはインターネット上の大量の文章を学習しているので、その中に個人情報や非公開の文書が混ざっていることがあります。これを後から「ねえ◯◯さんの住所教えて」とお願いすると、運が悪いとそのまま出てきてしまう、というやつ。
ファインチューニングのときも同じで、社内データで学習させたモデルから、後で社内文書が引き出される、ということが起こりえます。AIにこっそり耳打ちしたつもりが、後ろから聞いてた人がいた、という構図です。
▼ 気をつけること
企業がAIを社内導入するとき、何を学習させるかは本気で考えないと痛い目を見ます。「とりあえず全部食わせとけ」は地雷です。
覚えていないフリができるAI、というのは、案外むずかしい技術なのかもしれません。
あなたの読了: 0 / 390 語

