Whisper (Whisper)
▼ ざっくり言うと
OpenAIが作っている、音声認識AIの定番モデルです。
▼ もうちょっと詳しく
2022年にOpenAIが公開した音声認識モデル。オープンソースで、誰でも自分のPCで動かせます。多言語対応で日本語の精度もかなり高い。
会議の文字起こし、Podcastの字幕、Web会議ツールの自動キャプション、と幅広く使われていて、音声認識界のスタンダードになりつつあります。OpenAI製なのに無料で配ってる(=モデルウェイトが公開されてる)のが少し珍しい。
名前の「ささやき」感に反して、結構ハッキリ聞き取れるAIです。
あなたの読了: 0 / 388 語

