Whisperウィスパー (Whisper)

▼ ざっくり言うと

OpenAIが作っている、音声認識AIの定番モデルです。

▼ もうちょっと詳しく

2022年にOpenAIが公開した音声認識モデル。オープンソースで、誰でも自分のPCで動かせます。多言語対応で日本語の精度もかなり高い。

会議の文字起こし、Podcastの字幕、Web会議ツールの自動キャプション、と幅広く使われていて、音声認識界のスタンダードになりつつあります。OpenAI製なのに無料で配ってる(=モデルウェイトが公開されてる)のが少し珍しい。

名前の「ささやき」感に反して、結構ハッキリ聞き取れるAIです。

あなたの読了: 0 / 388