TAG:音色克隆

阿里通义千问开源Qwen3-TTS:97ms超低延迟 3秒克隆音色 改变实时AI语音格局

阿里通义千问开源Qwen3-TTS:97ms超低延迟 3秒克隆音色 改变实时AI语音格局

阿里通义千问团队开源Qwen3-TTS语音合成模型,采用端到端架构实现97ms超低延迟,支持3秒音色克隆和跨语言迁移,并能通过自然语言指令设计全新音色。该模型提供1.7B和0.6B双版本,适用于实时交互、多语言内容创作等场景,大幅降低AI语音应用门槛。

2026-01-23 13:57
35
0