TAG:强化学习
“踹不倒”的人形机器人开源了!清华、北大、银河通用、上海期智联合发布Any2Track框架!
清华、北大、银河通用和上海期智研究院联合发布Any2Track框架,通过两阶段强化学习解决了人形机器人动作追踪和抗干扰的核心难题。该框架包含AnyTracker通用动作追踪器和AnyAdapter动态适配模块,能在复杂地形、外力干扰等场景下稳定复刻人类动作,并在Unitree G1机器人上实现零样本仿真到真实世界的迁移,为人形机器人落地应用提供突破性解决方案。
《Science Robotics》封面:DeepMind发布RoboBallet,重新定义多机器人协同规划
DeepMind在《Science Robotics》封面发表的RoboBallet研究提出了一种基于图神经网络和强化学习的新框架,解决了多机器人系统中的任务分配、调度和运动规划三大核心挑战。该技术通过动态图表示和高效的离线训练,实现了在复杂环境中多个机器人的实时协同规划,计算效率比传统方法提升显著,为工业自动化提供了创新解决方案。
Science子刊:注意力机制+RL实现腿足机器人精确控制,100%障碍穿越成功率
苏黎世联邦理工学院在《Science Robotics》发表创新研究,通过结合强化学习和多头注意力机制,使腿足机器人能够自主识别地形关键信息并选择最优落脚点。该方法融合本体感知与外部地形数据,实现100%障碍穿越成功率,显著提升了机器人在复杂环境中的适应性和运动控制精度。
Science Robotics 封面论文:RoboBallet利用图神经网络和强化学习规划多机器人协作
DeepMind与伦敦大学合作开发的RoboBallet系统,利用图神经网络和强化学习技术,实现了在多机器人随机环境中的高效任务与运动规划。该系统能够处理任意障碍物几何形状、任务姿势和机器人位置,无需依赖手工设计的简化方案,解决了任务分配、调度和运动规划的联合优化问题。
《Science Robotics》重磅:仅需2小时,机器人柔性装配技能直逼人类顶尖水平
美国伯克利大学研究团队在《Science Robotics》发表突破性成果,开发出人机协同强化学习系统HIL-SERL。该系统仅需1-2.5小时真实训练,就能让机器人掌握精密装配、双臂协调等高难度操作技能,成功率接近100%,执行速度甚至超越人类水平,展现了卓越的适应性和抗干扰能力。
伦敦大学多机器人运动规划新方法登《Science Robotics》
伦敦大学学院与Google DeepMind等机构合作在《Science Robotics》发表创新研究,提出基于图神经网络和强化学习的多机器人运动规划方法。该方法通过GNN模型在数百万合成场景中训练,将机器人、任务和障碍映射为图结构,实现自动生成无碰撞轨迹,可泛化至新环境布局,仅需CAD文件和高级任务描述即可生成运动计划,大幅减少人工编程和调试需求。
直播预告| 大模型复杂推理技术: 如何重塑AI推理逻辑
本次直播将深入探讨大模型复杂推理技术的最新进展,重点介绍DeepSeek-R1等模型如何通过强化学习实现长思维链推理。中国人民大学赵鑫教授将分享慢思考技术的研究成果,施普林格·自然编辑总监常兰兰博士将介绍2025年人工智能图书资源。活动还将提供与大模型专家交流的机会,并有机会获得专业书籍和周边礼品。