フランスのAI企業・Mistral AIが、自然で感情豊かな音声を生成できるテキスト読み上げモデル「Voxtral TTS」を発表しました。主要な9言語に対応しているほか事前学習のいらない「ゼロショットクローンボイス再生」が可能で、文脈を理解して巧みな感情表現を行う音声を爆速で生成することができます。 続きを読む...