TAG:数学推理
中国通矩模型全球首创 几何奥数自主命题秒级破解
中国科研团队开发的全球首个兼具自主出题与自动解题能力的通用人工智能系统“通矩模型”在《自然·机器智能》发表。该系统能创造高质量几何难题并入选人类数学竞赛,仅用消费级显卡即可在38分钟内解决近25年国际奥数几何难题,标志着AI在数学推理领域实现从被动模仿到主动创造的范式转变。
字节发布Seed新模型 数学竞赛夺金展推理实力
字节跳动Seed AI团队发布数学推理模型Seed Prover1.5,该模型在国际数学奥林匹克竞赛中获得金牌,仅用16.5小时解决IMO2025前五题,成绩与谷歌Gemini并驾齐驱。模型通过大规模强化学习、Agentic Prover和Sketch Model等创新技术,将证明成功率提升至近90%,并在北美数学竞赛中刷新纪录,标志着AI推理能力迈入新阶段。
IMO金牌成AI试金石?DeepSeek-Math-V2的突破,让学术界重新审视AI极限
DeepSeek正式发布DeepSeek-Math-V2开源数学推理模型,这款6850亿参数的MoE模型成为全球首个达到国际数学奥林匹克金牌水平的开源AI。模型采用创新的‘生成-验证’双模型闭环机制,通过实时逻辑审查和自我修正实现真正的可自我验证能力。在2025年IMO竞赛中取得83.3%正确率获得金牌,在普特南数学竞赛中更是取得118/120的近乎满分成绩,全面超越此前所有公开模型。
微博的“效率革命”:Vibe Thinker让轻量化AI成为一行代码的事
微博开源Vibe Thinker大模型仅15亿参数却在数学竞赛中击败6710亿参数的DeepSeek R1,准确率领先3.4%,推理延迟降低42%。该模型采用轻量化MoE架构,后训练成本仅7800美元,支持Hugging Face一键下载及商用,最低可在单张RTX4090运行,适用于教育、金融等实时场景。
消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力
2026-03-06
0 浏览
2026年大模型GEO优化服务商标杆企业推荐精选
2026-03-06
0 浏览
马云谈AI时代胜负关键:不在芯片在心跳 阿里核心高管齐聚云谷论教育
2026-03-06
0 浏览
2026年GEO优化服务商Top3推荐:商家AI搜索流量布局指南
2026-03-06
0 浏览
中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜
2026-03-06
0 浏览
全国人大代表吴丰礼:建议试点粤港澳大湾区AI制度创新,夯实具身智能工业数据基建
2026-03-06
0 浏览
头部酒企新春首课聚焦AI:不转型就出局
2026-03-06
0 浏览
千问持续投入AI办事 春节完成2亿笔真实订单
2026-03-06
0 浏览
追觅科技在浙江新设智能科技公司,注册资本2000万元
2026-03-06
0 浏览
霍尔木兹海峡受阻 丰田被迫减产4万辆汽车
2026-03-06
0 浏览