TAG:语音大模型
语音交互的“GPT时刻”:当MOSS学会“直接听、直接说”,传统方案全面过时
复旦大学MOSS团队开源国内首个端到端语音到语音大模型MOSS-Speech,采用创新层拆分架构,无需传统ASR→LLM→TTS流程即可实现语音问答、情绪模仿和笑声生成。在ZeroSpeech2025评测中WER低至4.1%,情感识别准确率91.2%,中文口语MOS分达4.6接近真人水平。提供48kHz超采样和16kHz轻量版本,支持单张RTX4090实时推理,延迟低于300ms,已开放商用许可。
均普智能回应募投延期及场地出租 重启10亿元定增布局机器人领域
2026-03-07
0 浏览
大厂布局养龙虾产业 腾讯小米纷纷涉足背后有何考量
2026-03-07
0 浏览
AI助力养龙虾热潮 腾讯小米布局上门安装服务
2026-03-07
0 浏览
OpenClaw爆火引热议,不同群体以独特方式参与安装热潮
2026-03-07
0 浏览
刘忠军教授:推动创新医疗技术在AI领域的应用
2026-03-07
0 浏览
李萌:人形机器人何时迎来"iPhone时刻"?智能玩具或成新兴大产业
2026-03-07
0 浏览
帕西尼再获超10亿融资 估值突破百亿 以全球唯一百亿级实采全模态数据重塑具身智能模型天花板
2026-03-07
0 浏览
斯坦福李飞飞团队提出新框架 机器人可从错误中学习
2026-03-07
0 浏览
西南科大爬壁机器人实现全角度翻转突破
2026-03-07
0 浏览
穆南杉提出人类AI智能体生命进化理论
2026-03-07
0 浏览