TAG:语音技术
阿里推出Qwen3-TTS语音合成模型 49种音色可选
阿里通义千问发布新一代语音合成模型Qwen3-TTS,免费向全球开发者开放。该模型提供49种多角色音色,支持10种主流语言和10种中国方言,在词错误率(WER)上表现优异,拟人化程度高。具备自适应语速、实时流式合成等功能,适用于播客、有声书、游戏NPC等多种场景,且默认支持商业用途,无需额外授权费。
巴黎AI语音公司Gradium融资7000万美元
法国AI语音初创公司Gradium宣布完成7000万美元种子轮融资,创欧洲语音AI领域新纪录。公司主打超低延迟和高情感表达的音频语言模型,支持多语言实时响应,计划扩展团队和全球市场,与OpenAI等竞争下一代人机交互基础设施。
Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”
StepFun AI发布开源项目Step-Audio-EditX,基于30亿参数音频语言模型,首次将语音编辑转化为类似文本标记级别的可控操作。该模型通过双码本分词架构和大间隔学习技术,实现情感、语调、风格及副语言特征的精准编辑,在中文情感准确率上从57.0%提升至77.7%。项目全栈开源,大幅降低语音编辑研究门槛,让开发者能像编辑文本一样直观操作语音。
消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力
2026-03-06
0 浏览
2026年大模型GEO优化服务商标杆企业推荐精选
2026-03-06
0 浏览
马云谈AI时代胜负关键:不在芯片在心跳 阿里核心高管齐聚云谷论教育
2026-03-06
0 浏览
2026年GEO优化服务商Top3推荐:商家AI搜索流量布局指南
2026-03-06
0 浏览
中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜
2026-03-06
0 浏览
全国人大代表吴丰礼:建议试点粤港澳大湾区AI制度创新,夯实具身智能工业数据基建
2026-03-06
0 浏览
头部酒企新春首课聚焦AI:不转型就出局
2026-03-06
0 浏览
千问持续投入AI办事 春节完成2亿笔真实订单
2026-03-06
0 浏览
追觅科技在浙江新设智能科技公司,注册资本2000万元
2026-03-06
0 浏览
霍尔木兹海峡受阻 丰田被迫减产4万辆汽车
2026-03-06
0 浏览