TAG:实时语音合成
微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用
微软推出VibeVoice-Realtime-0.5B,这是一款轻量级实时文本转语音模型,支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音,特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化,它在LibriSpeech测试中字错误率仅2.00%,表现卓越,为AI语音合成提供了高效解决方案。
理想汽车遇困 机器人业务成救命稻草
2026-03-18
0 浏览
蓝芯算力获数亿融资 创始人为字节前芯片负责人
2026-03-18
0 浏览
360发布反AI投毒监测工具 促GEO行业规范发展
2026-03-18
0 浏览
日本乐天AI 3.0开源风波:删除DeepSeek许可证后紧急补救
2026-03-18
0 浏览
科技股回暖带动市场情绪 存储芯片持续走强 周期股逆市下挫
2026-03-18
0 浏览
英伟达连发7款重磅芯片 从芯片商转型AI工厂 黄仁勋战略转向
2026-03-18
0 浏览
国内SaaS行业面临AI挑战 如何应对市场变革
2026-03-18
0 浏览
鹏华陈大烨前瞻布局AI全链条 从算力基建到应用投资
2026-03-18
0 浏览
王兴兴放话G1机器人全球领先 20年后仍经典 揭秘春晚机器人幕后
2026-03-18
0 浏览
多路资金博弈存储芯片股 游资联手量化抢筹金开新能
2026-03-18
0 浏览