TAG:编程能力
腾讯发布混元3.0大模型,编程能力大幅提升
腾讯近日推出新一代AI大模型混元3.0(Hy3),核心编程能力实现飞跃,在SWE-Bench测试中性能提升超40%。该模型采用MoE架构,具备262K长上下文处理能力及高效推理速度,性能逼近国内顶尖水平。混元3.0的发布标志着腾讯在AI研发上的重大突破,为开发者提供了更强力的工具,进一步加剧了大模型市场的竞争。
欧洲AI巨头推出全能模型Mistral Small 4 支持推理多模态编程
Mistral AI 发布全能型大模型 Mistral Small4,首次在单一模型中集成旗舰级推理、多模态理解和编程能力。采用 MoE 架构,拥有 256k 超长上下文窗口,性能较前代提升显著,并以 Apache2.0 协议开源,为开发者提供高效灵活的选择。
国产模型领跑OpenRouter token使用量激增 编程与智能体成关键优势
春节期间国产大模型在OpenRouter平台表现亮眼,调用量占比达61%,其中MiniMax M2.5、Kimi K2.5和GLM-5位列前三。文章指出编程能力和智能体任务自动化已成为大模型竞争的核心,国产模型凭借卓越性能和高性价比优势,正推动token消耗量大幅增长,并加速AI应用场景的落地。
GLM-5大模型支持7大国产芯片平台 编程能力显著提升
GLM-5大模型在编程能力上取得全球领先,支持七大国产芯片平台,展现出中国AI领域的强大实力。通过引入DSA稀疏注意力机制等四大技术创新,显著提升了性能和效率,降低了部署成本。
马斯克称 Grok AI 编程能力将超 Claude 于六月 科技竞争升级
马斯克宣布Grok AI将于6月发布新模型,目标在编程能力上超越竞争对手Claude。文章分析了当前AI编程领域的竞争格局,包括Anthropic的Opus和Sonnet版本的表现,以及Grok AI的优势与挑战,探讨了科技巨头间的AI战火如何影响未来技术发展。
GPT-5没有追求AGI,它代表的是OpenAI的商业化野心
OpenAI 发布 GPT-5,性能仅领先竞争对手个位数,失去代差优势。其训练采用合成数据,Agent 变得重要,在编程方面着重升级,擅长智能体式编码和修改 bug。GPT-5 是 OpenAI 加强商业化的产物,降低幻觉、提高上下文长度等。模型进步进入瓶颈期,但对创业者并非坏事,AI 应用靠速度、创新和用户感知,Notion 创始人对此持乐观态度。