TAG:机器人学习

机器人的“楚门世界”:用第一视角视频喂养的AI,将永远活在人类的“主观现实”里

机器人的“楚门世界”:用第一视角视频喂养的AI,将永远活在人类的“主观现实”里

加州大学圣地亚哥分校团队开发Human0机器人操控基础模型,通过1000小时人类第一视角数据集PHSD和两阶段训练框架,解决了机器人泛化能力不足的问题。模型采用'野生场景+任务导向'数据组合,结合域对抗判别器技术,使机器人能够理解未见过的语言指令并通过少量演示快速学习新技能,在人形机器人实测中展现出优秀的适应性和性能。

爱力方 2025-11-25 15:28
0
0

IJRR北邮首篇,联合三星中国研究院、清华大学等共同探讨“机器人操作大模型”

IJRR北邮首篇,联合三星中国研究院、清华大学等共同探讨“机器人操作大模型”

北京邮电大学联合三星中国研究院、清华大学等机构在IJRR发表首篇机器人操作大模型综述,探讨基础模型如何解决机器人通用操作面临的七大挑战。文章系统分析了LLMs、VFMs、VLMs等基础模型在机器人交互、感知、决策等关键环节的应用潜力,并提出从L0级别逐步实现通用操作的框架路径,为机器人学习领域提供重要理论指导。


当训练数据成为“皇帝的新衣”:AI生成的视频,会让机器人永远学不会走路吗?

当训练数据成为“皇帝的新衣”:AI生成的视频,会让机器人永远学不会走路吗?

DeepMind联合多所高校推出PhysWorld框架,通过视频生成与物理世界建模的深度融合,让机器人仅凭单张图像和文字指令就能观看生成视频学习复杂操作。该框架解决了生成视频缺乏物理可行性的核心难题,无需真实机器人演示数据即可实现零样本技能迁移,大幅降低机器人学习成本。

爱力方 2025-11-21 14:47
0
0

18岁华裔少年开源全球最大第一视角数据集!包含2138名工人、1万小时、10.8亿帧画面、共16.4TB总量!

18岁华裔少年开源全球最大第一视角数据集!包含2138名工人、1万小时、10.8亿帧画面、共16.4TB总量!

18岁华裔少年Eddy Xu创立的build.ai公司发布了全球最大第一视角开源数据集Egocentric-10K,包含2138名工厂工人的1万多小时视频、10.8亿帧画面,总规模达16.4TB。该数据集采用隐蔽头戴式摄像头采集,涵盖各类工业操作场景,可为机器人模仿学习提供高质量训练数据,有望推动工厂安全、家用机器人和AI医疗等领域发展。

2025-11-12 15:42
13
0

1段演示=千次练习?李飞飞团队提出MOMAGEN框架破解机器人做家务难题!

1段演示=千次练习?李飞飞团队提出MOMAGEN框架破解机器人做家务难题!

斯坦福李飞飞团队与德州大学奥斯汀分校合作提出MOMAGEN框架,通过约束优化技术仅需1段人类演示就能生成大规模多样化训练数据,解决了双臂移动机器人学习复杂家务技能时面临的数据采集成本高、移动操作适配难等核心难题。该框架通过硬约束确保机器人可达性和可见性,软约束提升操作质量,让机器人低成本掌握整理餐桌、清洁平底锅等复杂家务任务。

2025-11-10 16:16
0
0

10分钟的“师徒传承”:AgiBot攻克机器人快速学习难题,“中国智造”迎来新变量

10分钟的“师徒传承”:AgiBot攻克机器人快速学习难题,“中国智造”迎来新变量

上海AgiBot公司突破工业自动化关键技术,仅需10分钟即可教会机器人完成复杂制造任务。该技术结合人机远程操作与强化学习,工人通过远程引导后AI系统接管优化,实现机器人自我改进。G2人形机器人已在生产线投入使用,大幅缩短传统数周编程周期,为制造业带来前所未有的灵活性与竞争力。

爱力方 2025-11-06 16:23
14
0

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清华大学与北京大学联合团队推出MotionTrans框架,实现从人类VR数据到机器人的端到端零样本技能迁移。该技术无需机器人演示数据,仅通过人类动作采集即可让机器人学会倒水、拔插座等日常任务,并在少量微调后成功率大幅提升至50%以上。研究团队已开源完整技术报告、代码和数据集,推动机器人学习领域新发展。

2025-11-05 16:04
10
0

通研院团队斩获CoRL 2025 杰出论文奖:UniFP 技术突破足式机器人力-位控制难题,系中国籍团队首次获此殊荣

通研院团队斩获CoRL 2025 杰出论文奖:UniFP 技术突破足式机器人力-位控制难题,系中国籍团队首次获此殊荣

北京通用人工智能研究院团队在CoRL 2025会议上凭借UniFP技术荣获杰出论文奖,这是中国籍团队首次获此殊荣。UniFP是足式机器人领域首个力-位统一控制算法,通过单一框架实现位置控制、力控制和阻抗控制的灵活切换,并创新性地实现无传感器力感知。该技术已在Unitree B2-Z1平台上验证,展现精准力控制和自适应交互能力,标志着中国在机器人学习领域达到全球领先水平。

机器人大讲堂 2025-10-12 21:03
15
0

仅需10-20次演示,机器人就能学会叠衣服、倒方块!ControlVLA破解少样本操作难题!

仅需10-20次演示,机器人就能学会叠衣服、倒方块!ControlVLA破解少样本操作难题!

清华大学与BIGAI团队提出的ControlVLA框架,通过给预训练VLA模型添加对象导航仪,仅需10-20次人类演示就能让机器人学会叠衣服、倒方块等精细操作。在8项真实世界任务测试中达到76.7%成功率,相比传统方法减少80%以上演示需求,有效解决了机器人学习中的数据效率与泛化能力难题。

2025-10-10 10:23
0
0

机器人终于“学会变通”?千寻智能提出State-free Policy纯视觉运动策略,让机器人泛化能力飙升

机器人终于“学会变通”?千寻智能提出State-free Policy纯视觉运动策略,让机器人泛化能力飙升

千寻智能研究团队提出State-free Policy纯视觉运动策略,摒弃传统机器人对本体感知状态的依赖,仅通过视觉观察指导机器人完成任务。该策略采用相对末端执行器动作空间和完整任务观察设计,显著提升了机器人的空间泛化能力、数据效率和跨具体化适应能力。实验显示在拾笔入筒等任务中,无状态策略在高度和水平变化环境下保持高成功率,解决了传统策略在动态环境中的泛化瓶颈。

2025-10-09 10:59
0
0

跨形态学习来了!轮式机器人的“经验”如何轻松传给双足机器人?

跨形态学习来了!轮式机器人的“经验”如何轻松传给双足机器人?

浙江大学与西湖大学研究团队提出TrajBooster创新框架,通过轨迹重定向技术实现跨形态机器人知识迁移。该技术利用轮式机器人的丰富操作数据,仅需10分钟真实数据即可让双足机器人学会复杂全身操控任务,显著提升动作学习效率和零样本迁移能力,为解决机器人数据稀缺问题提供了新思路。

2025-09-24 10:52
0
0

顶会收录!机器人刷视频就能学会操作?南科大×逐际动力×港大新成果

顶会收录!机器人刷视频就能学会操作?南科大×逐际动力×港大新成果

南方科技大学CLEAR Lab、逐际动力和香港大学的联合研究成果被CoRL 2025收录,提出GVF-TAPE算法让机器人通过观看视频学习操作技能。该技术突破传统示教模式,使机器人能够生成RGB-D视频预测任务执行过程,实现自主操作,大幅降低训练成本并提高泛化能力。

2025-09-19 10:18
0
0