Mistral发布开源TTS模型Voxtral，号称超越ElevenLabs

Available in: 中文

2026-03-26T16:39:31.379Z·1 min read

Mistral AI发布了Voxtral TTS，首个专为 enterprise 设计的前沿级开源权重文本转语音模型，让企业在不依赖专有API的情况下完全掌控语音AI。

Mistral以开源权重TTS挑战ElevenLabs

Mistral AI发布了Voxtral TTS，首个专为 enterprise 设计的前沿级开源权重文本转语音模型，让企业在不依赖专有API的情况下完全掌控语音AI。

Voxtral TTS是一个30亿参数模型，可在笔记本电脑上运行，速度比实时语音快6倍。架构包含三个组件：

2026年全球语音AI市场规模突破220亿美元，语音AI Agent 预计到2034年将达475亿美元。主要竞争对手包括：

所有主要竞争对手都采用专有API模式，而Mistral发布完整模型权重。企业可自行部署，无需向第三方发送任何音频数据。

估值138亿美元的Mistral正在构建完整的企业自主AI技术栈：

Mistral科学副总裁Pierre Stock表示："我们认为音频是重大赌注，是所有AI模型未来关键甚至唯一的交互界面。"

前沿级开源TTS为有严格数据主权要求的企业（医疗、金融、国防）打开了语音AI的大门——这些场景下向第三方API发送音频数据并不可行。

Comments0