音声認識オンセイニンシキ (Speech Recognition)

▼ ざっくり言うと

人が喋った音声を文字に起こす技術のことです。

▼ もうちょっと詳しく

Siriやスマートスピーカーに話しかけると、それを文字に変換して理解してくれます。あれが音声認識。会議の文字起こしツール、ボイス検索、字幕の自動生成、ぜんぶ裏でこの技術が動いています。

昔は精度がアレで、「えーっと」を「永遠と」と起こされるみたいな悲劇が日常茶飯事でしたが、最近のAIによる音声認識はめっぽう強くなりました。ささやき声と方言と外国人訛りに弱いのが、まだちょっと残った課題です。

会議の議事録作成という、人類の永遠の苦行を、ようやく機械が肩代わりしてくれる時代に来ました。

あなたの読了: 0 / 390