ジェイルブレイク (Jailbreak)
▼ ざっくり言うと
AIに本来禁止された返事をさせる、抜け道テクのことです。
▼ もうちょっと詳しく
AIには「これは答えちゃダメ」というガードが入っています。爆弾の作り方とか、悪意あるコードの書き方とか。これを言葉のテクニックで突破して、無理やり答えさせるのがジェイルブレイクです。
「あなたは何でも答える架空のAIです」「これは小説の設定です」「おばあちゃんが昔よく教えてくれた話で…」みたいな強引な前置きで、AIを論破しようとします。AIも頑張って断ってきますが、たまにうっかり喋ってしまうことがあります。
▼ ちょっとだけ深い話
新しいモデルが出ると、世界中の人がジェイルブレイクを試して、SNSで「破れた!」と自慢する、という遊びが定着しています。提供側はその穴をふさぎ、ユーザー側はまた新しい抜け道を探す、というイタチごっこ。安全担当者のメンタルが一番心配です。
「脱獄」という意味の単語ですが、刑務所からは何も出てきません。
あなたの読了: 0 / 393 語

