TAG:实时语音合成
微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用
微软推出VibeVoice-Realtime-0.5B,这是一款轻量级实时文本转语音模型,支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音,特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化,它在LibriSpeech测试中字错误率仅2.00%,表现卓越,为AI语音合成提供了高效解决方案。
特斯拉股价逆势上扬 SpaceX上市前马斯克整合战略曝光
2026-01-31
0 浏览
谷歌开放世界模型精灵 AI开启凭空造世时代
2026-01-31
0 浏览
北京首个人形机器人中试验证平台启动 打通量产最后一公里
2026-01-31
0 浏览
AI迈入智能体时代,CPU如何成为算力核心
2026-01-31
0 浏览
中科院院士韩布兴:AI赋能化工 变废为宝
2026-01-31
0 浏览
武强院士:AI破解我国能源三大核心难题
2026-01-31
0 浏览
钟发平:AI+零碳园区破解源网荷储碎片化难题
2026-01-31
0 浏览
法国基金逆市抄底微软 豪赌AI翻盘
2026-01-31
0 浏览
印度牙医博士研发首款人形机器人 九个月后全球发售
2026-01-31
0 浏览
AI赋能能源产业大会在京召开
2026-01-31
0 浏览