TAG:数学推理

字节发布Seed新模型 数学竞赛夺金展推理实力

字节发布Seed新模型 数学竞赛夺金展推理实力

字节跳动Seed AI团队发布数学推理模型Seed Prover1.5,该模型在国际数学奥林匹克竞赛中获得金牌,仅用16.5小时解决IMO2025前五题,成绩与谷歌Gemini并驾齐驱。模型通过大规模强化学习、Agentic Prover和Sketch Model等创新技术,将证明成功率提升至近90%,并在北美数学竞赛中刷新纪录,标志着AI推理能力迈入新阶段。

爱力方 2025-12-25 18:00
7
0

IMO金牌成AI试金石?DeepSeek-Math-V2的突破,让学术界重新审视AI极限

IMO金牌成AI试金石?DeepSeek-Math-V2的突破,让学术界重新审视AI极限

DeepSeek正式发布DeepSeek-Math-V2开源数学推理模型,这款6850亿参数的MoE模型成为全球首个达到国际数学奥林匹克金牌水平的开源AI。模型采用创新的‘生成-验证’双模型闭环机制,通过实时逻辑审查和自我修正实现真正的可自我验证能力。在2025年IMO竞赛中取得83.3%正确率获得金牌,在普特南数学竞赛中更是取得118/120的近乎满分成绩,全面超越此前所有公开模型。

爱力方 2025-11-28 11:56
4
0

微博的“效率革命”:Vibe Thinker让轻量化AI成为一行代码的事

微博的“效率革命”:Vibe Thinker让轻量化AI成为一行代码的事

微博开源Vibe Thinker大模型仅15亿参数却在数学竞赛中击败6710亿参数的DeepSeek R1,准确率领先3.4%,推理延迟降低42%。该模型采用轻量化MoE架构,后训练成本仅7800美元,支持Hugging Face一键下载及商用,最低可在单张RTX4090运行,适用于教育、金融等实时场景。

爱力方 2025-11-18 17:12
7
0