TAG:数学推理

中国通矩模型全球首创 几何奥数自主命题秒级破解

中国通矩模型全球首创 几何奥数自主命题秒级破解

中国科研团队开发的全球首个兼具自主出题与自动解题能力的通用人工智能系统“通矩模型”在《自然·机器智能》发表。该系统能创造高质量几何难题并入选人类数学竞赛,仅用消费级显卡即可在38分钟内解决近25年国际奥数几何难题,标志着AI在数学推理领域实现从被动模仿到主动创造的范式转变。

2026-01-27 13:52
0
0

字节发布Seed新模型 数学竞赛夺金展推理实力

字节发布Seed新模型 数学竞赛夺金展推理实力

字节跳动Seed AI团队发布数学推理模型Seed Prover1.5,该模型在国际数学奥林匹克竞赛中获得金牌,仅用16.5小时解决IMO2025前五题,成绩与谷歌Gemini并驾齐驱。模型通过大规模强化学习、Agentic Prover和Sketch Model等创新技术,将证明成功率提升至近90%,并在北美数学竞赛中刷新纪录,标志着AI推理能力迈入新阶段。

爱力方 2025-12-25 18:00
7
0

IMO金牌成AI试金石?DeepSeek-Math-V2的突破,让学术界重新审视AI极限

IMO金牌成AI试金石?DeepSeek-Math-V2的突破,让学术界重新审视AI极限

DeepSeek正式发布DeepSeek-Math-V2开源数学推理模型,这款6850亿参数的MoE模型成为全球首个达到国际数学奥林匹克金牌水平的开源AI。模型采用创新的‘生成-验证’双模型闭环机制,通过实时逻辑审查和自我修正实现真正的可自我验证能力。在2025年IMO竞赛中取得83.3%正确率获得金牌,在普特南数学竞赛中更是取得118/120的近乎满分成绩,全面超越此前所有公开模型。

爱力方 2025-11-28 11:56
4
0

微博的“效率革命”:Vibe Thinker让轻量化AI成为一行代码的事

微博的“效率革命”:Vibe Thinker让轻量化AI成为一行代码的事

微博开源Vibe Thinker大模型仅15亿参数却在数学竞赛中击败6710亿参数的DeepSeek R1,准确率领先3.4%,推理延迟降低42%。该模型采用轻量化MoE架构,后训练成本仅7800美元,支持Hugging Face一键下载及商用,最低可在单张RTX4090运行,适用于教育、金融等实时场景。

爱力方 2025-11-18 17:12
7
0