TAG:实时语音合成
微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用
微软推出VibeVoice-Realtime-0.5B,这是一款轻量级实时文本转语音模型,支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音,特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化,它在LibriSpeech测试中字错误率仅2.00%,表现卓越,为AI语音合成提供了高效解决方案。
当机器人,长出“六条手臂”:美的发布“美罗 U”
2025-12-08
0 浏览
领克08起火爆炸 消防紧急扑救
2025-12-08
0 浏览
AI陪伴与潮玩:高退货率揭示情绪泡沫
2025-12-08
0 浏览
Meta收购AI可穿戴公司Limitless 加码智能硬件创新
2025-12-08
0 浏览
诺奖得主解析四大智能趋势 助你把握AI时代
2025-12-08
0 浏览
智元机器人产量突破五千台
2025-12-08
0 浏览
自助棋牌加盟品牌推荐:智能科技重塑线下娱乐体验
2025-12-08
0 浏览
东威科技500万项目环评获原则通过
2025-12-08
0 浏览
C罗注资AI搜索企业Perplexity 共建粉丝互动平台
2025-12-08
0 浏览
英伟达小模型成本仅为GPT-5 Pro三十六分之一
2025-12-08
0 浏览