音声認識 (Speech Recognition)
▼ ざっくり言うと
人が喋った音声を文字に起こす技術のことです。
▼ もうちょっと詳しく
Siriやスマートスピーカーに話しかけると、それを文字に変換して理解してくれます。あれが音声認識。会議の文字起こしツール、ボイス検索、字幕の自動生成、ぜんぶ裏でこの技術が動いています。
昔は精度がアレで、「えーっと」を「永遠と」と起こされるみたいな悲劇が日常茶飯事でしたが、最近のAIによる音声認識はめっぽう強くなりました。ささやき声と方言と外国人訛りに弱いのが、まだちょっと残った課題です。
会議の議事録作成という、人類の永遠の苦行を、ようやく機械が肩代わりしてくれる時代に来ました。
あなたの読了: 0 / 390 語

