TAG:世界模型
大晓机器人12月18日开源世界模型开悟3.0
大晓机器人宣布将于12月18日开源国内首个实现商业应用的“开悟”世界模型3.0(Kairos 3.0),并发布多项全球领先技术。公司汇聚陶大程等顶尖AI科学家与产业专家,通过创新的ACE技术范式和环境式数据采集,致力于解决具身智能领域的技术突破与商业化落地难题,与行业伙伴共建开放生态。
大晓机器人亮相,首席科学家领衔打造国内首款开源商用世界模型
大晓机器人将于12月18日正式亮相,发布包括全球首创ACE技术范式及国内首个开源且商业落地的‘开悟’世界模型3.0在内的多项领先技术。公司由商汤科技联合创始人王晓刚出任董事长,AI科学家陶大程担任首席科学家,旨在构建自主可控的具身智能产业体系,并推出具身超级大脑模组A1,推动在安防、巡检等场景的规模化商业应用。
智源研究院发布最强多模态世界模型Emu3.5 可预测真实世界下一秒
北京智源人工智能研究院发布新一代多模态大模型Emu3.5,通过统一建模图像、文本和视频,实现世界级理解。模型核心突破在于Next State Prediction任务,能预测真实世界的下一秒状态,从生成内容进化到模拟物理规律。这标志着AI从‘像素搬运工’迈向‘世界模拟器’,有望应用于机器人、自动驾驶等高级场景。
商汤联合创始人王晓刚任大晓机器人董事长
商汤科技联合创始人王晓刚出任大晓机器人董事长,公司将于12月18日正式亮相,发布多项技术与产品阵列,并推出国内首个开源且实现商业应用的‘开悟’世界模型3.0,标志着人工智能与机器人领域的重要进展。
这可能是AI圈最贵的一次离职:200亿美元“世界模型”路线的存亡时刻
Meta首席AI科学家杨立昆宣布计划离职创业,将专注于开发基于"世界模型"的新一代人工智能技术。他主张通过多模态数据构建AI的内部世界模型,使机器能像人类一样通过交互学习物理因果关系,这被视为对当前大语言模型(LLM)路线的公开挑战。消息引发Meta股价下跌,市场预计其创业公司将吸引寻求下一代AI技术的资本关注。
当AI开始“理解”空间:世界模型能否重新定义AI的未来?
文章探讨了AI领域的新突破——世界模型技术,重点介绍了李飞飞团队推出的首款商用产品Marble。世界模型使AI系统能够理解物理规则、预测未来场景状态,并具备不确定性量化和多时间尺度推理能力。这一技术被视为通向通用人工智能的关键一步,将在机器人、自动驾驶等领域产生深远影响。
具身智能大脑的进化之路
本报告深入分析具身智能大脑的发展现状,从算法架构、数据生态到底层支持全面解析最新进展。报告指出具身智能正从模型驱动转向数据驱动,分层控制、VLA范式和世界模型构成核心算法框架,同时探讨了机器人数据获取、安全与应用的关键挑战。报告还解析了Scaling Law、Benchmark标准化和物理AI等热点议题,为理解具身智能迈向通用智能的进化路径提供专业洞察。
Meta首席AI科学家Yann LeCun或将离职创立世界模型研究公司
据《金融时报》报道,Meta首席AI科学家、图灵奖得主Yann LeCun计划离职创办新公司,专注于世界模型研究。世界模型是一种能够理解环境并模拟因果关系的AI系统,目前谷歌DeepMind等机构也在积极开发。这一变动正值Meta重组AI部门、应对OpenAI等竞争对手之际,而LeCun对当前大型语言模型的过度宣传持保留态度,认为AI技术仍需实质性突破。
超越Sora,通往物理世界:贾奎详解世界模型驱动的具身智能新范式
当前人形机器人在物理行动上面临的挑战,分析了传统AI模型在理解物理世界本质方面的局限性。文章介绍了世界模型(World Model)的概念和跨维智能提出的GS-World生成式仿真世界模型,这一创新范式从预测视觉表象转向生成物理机理,为具身智能提供了新的发展方向。同时提出了效率法则(Efficiency Law),强调数据生成效率在物理智能中的核心地位。
世界模型有望带来机器人与具身智能的下一个“奇点时刻”?
世界模型作为生成式AI与机器人技术深度融合的产物,正在重塑具身智能的核心逻辑。本文解析了世界模型如何通过对真实世界的高维认知建模,赋予机器人环境理解、趋势预测和主动决策能力,推动行业从'机械执行'向'智能认知'进化。文章详细探讨了世界模型的技术内核、三重内化特性及其在机器人领域的产业化应用前景。
千诀科技ICML 2025论文:“世界模型”破解AI“常识难题”,机器人有望迈向“知行合一”
千诀科技章天任博士团队在ICML 2025发表的研究首次捕捉到神经网络自发形成世界模型的瞬间,通过建立严格的数学定义揭示了简单性偏置与世界建模能力的关系。这项突破性工作让机器人有望实现'知行合一',具备泛化适应、高效学习和因果推理能力,为破解AI常识难题迈出关键一步。
清华陈建宇团队× 斯坦福Chelsea课题组推出 Ctrl-World 可控世界模型,让机器人在想象中迭代
清华大学陈建宇团队与斯坦福大学Chelsea Finn课题组联合推出可控生成世界模型Ctrl-World,该模型能让机器人在虚拟想象空间中进行任务预演和策略评估,无需真实世界数据即可大幅提升机器人操作成功率。通过多视角预测、细粒度动作控制和长时程动态维持三大创新技术,解决了传统世界模型的幻觉、控制不精细和一致性差等问题,将机器人策略在下游任务中的成功率从38.7%提升至83.4%。
智源研究院发布悟界Emu3.5,开启多模态世界大模型新纪元
智源研究院发布Emu3.5多模态世界大模型,通过自回归架构实现'Next-State Prediction',具备10万亿token训练规模和34B参数量。该模型突破性地融合了多模态理解与生成能力,能够执行复杂任务规划、动态世界模拟和具身交互操作,为通用人工智能发展提供了可度量的实践路径,开启了从数字世界迈向物理世界的新纪元。
阿里新研究:统一了VLA和世界模型
阿里巴巴达摩院联合浙江大学提出WorldVLA框架,首次将视觉语言动作模型与世界模型相统一。该框架通过三套独立分词器处理图像、文本和动作,采用创新的注意力掩码设计,实现了动作生成与视觉理解的相互增强。实验证明WorldVLA在机器人操作任务中显著优于独立模型,为具身智能发展提供了新思路。
LeCun怒揭机器人最大骗局,坦白Llama与我无瓜
Meta首席AI科学家LeCun在MIT讲座中直言人形机器人是AI圈最大骗局,指出当前机器人仅具备窄智能,无法实现通用智能。他批评大语言模型(LLM)只是记忆力好但缺乏真实智能,强调世界模型才是实现通用人工智能的关键。文章还记录了特斯拉、Figure等公司对LeCun观点的激烈反驳,并回顾了LeCun在AI领域的开创性贡献。