音声AI (6件)

ElevenLabs (ElevenLabs)
圧倒的にリアルな音声を生成できる、音声AIのスタートアップです。
Whisper (Whisper)
OpenAIが作っている、音声認識AIの定番モデルです。
音声合成 (Speech Synthesis / TTS)
文字をAIに喋らせる技術のことです。
音声認識 (Speech Recognition)
人が喋った音声を文字に起こす技術のことです。
Gemini Omni (Gemini Omni)
GeminiアプリでVeoの後継として導入された、Googleの最新動画生成・編集モデルです。
Suno (Suno)
歌詞と曲調を指定するだけで楽曲を作ってくれる音楽生成AIです。