音声AI (6件)
- ElevenLabs (ElevenLabs)
- 圧倒的にリアルな音声を生成できる、音声AIのスタートアップです。
- Whisper (Whisper)
- OpenAIが作っている、音声認識AIの定番モデルです。
- 音声合成 (Speech Synthesis / TTS)
- 文字をAIに喋らせる技術のことです。
- 音声認識 (Speech Recognition)
- 人が喋った音声を文字に起こす技術のことです。
- Gemini Omni (Gemini Omni)
- GeminiアプリでVeoの後継として導入された、Googleの最新動画生成・編集モデルです。
- Suno (Suno)
- 歌詞と曲調を指定するだけで楽曲を作ってくれる音楽生成AIです。


