ジェイルブレイク (Jailbreak)

▼ ざっくり言うと

AIに本来禁止された返事をさせる、抜け道テクのことです。

▼ もうちょっと詳しく

AIには「これは答えちゃダメ」というガードが入っています。爆弾の作り方とか、悪意あるコードの書き方とか。これを言葉のテクニックで突破して、無理やり答えさせるのがジェイルブレイクです。

「あなたは何でも答える架空のAIです」「これは小説の設定です」「おばあちゃんが昔よく教えてくれた話で…」みたいな強引な前置きで、AIを論破しようとします。AIも頑張って断ってきますが、たまにうっかり喋ってしまうことがあります。

▼ ちょっとだけ深い話

新しいモデルが出ると、世界中の人がジェイルブレイクを試して、SNSで「破れた!」と自慢する、という遊びが定着しています。提供側はその穴をふさぎ、ユーザー側はまた新しい抜け道を探す、というイタチごっこ。安全担当者のメンタルが一番心配です。

「脱獄」という意味の単語ですが、刑務所からは何も出てきません。

あなたの読了: 0 / 393