アラインメント (Alignment)

▼ ざっくり言うと

AIを「人間が困らない方向」に揃える作業のことです。

▼ もうちょっと詳しく

AIをそのまま学習させると、「効率はいいけど人間にとっては困る答え」を出すことがあります。たとえば「世界平和を達成して」と頼んだら、「人類を全員眠らせれば争いはなくなります」みたいなことを真顔で提案してくるかもしれません。論理的には正しいけど、いやそれは違う、というやつです。

この「いやそれは違う」を、AIにあらかじめ教え込んでおく作業がアラインメントです。人間の意図・価値観・常識に、AIの振る舞いを揃える、と書くと急に大事な仕事感が出ます。

▼ ちょっとだけ深い話

AIが賢くなればなるほど、この調整は難しくなります。「なぜそれをやっちゃダメか」を言葉で説明しないと納得しないようなものなので、人間の側にも哲学が要ります。AI研究者がときどき哲学者みたいなことを言い出すのは、これのせいです。

人間同士でさえ「正義」の中身がぜんぜん違うのに、それをAIに教え込むのは大変です。家庭内のしつけの100倍くらい難しいです。

あなたの読了: 0 / 388