TAG:阿里通义

阿里通义发布Qwen3-Omni-Flash新版本

阿里通义发布Qwen3-Omni-Flash新版本

阿里通义Qwen团队发布最新全模态大模型Qwen3-Omni-Flash-2025-12-01,该版本基于Qwen3-Omni构建,支持文本、图像、音频和视频等多种输入形式,实现实时流式响应。升级亮点包括音视频交互体验全面优化、系统提示自定义功能开放、多语言处理能力增强以及语音生成更拟人化,显著提升了人机交互的自然度与精准度。

2025-12-11 16:29
0
0

阿里通义发布SAPO强化学习法,提升大语言模型性能

阿里通义发布SAPO强化学习法,提升大语言模型性能

阿里通义Qwen团队推出新型强化学习方法SAPO,通过平滑温度控制门控函数替代传统硬剪切,有效解决大语言模型在强化学习中的策略优化不稳定问题。该方法具备连续信任域、序列级一致性和token级自适应性等优势,在数学推理、代码生成等任务上表现显著优于GRPO和GSPO,为AI研究提供了新方向。

2025-12-10 18:15
0
0