TAG:机器人操作
UT Dallas与Nvidia开源HO-Cap方案 含65万帧高质量数据
UT Dallas与Nvidia联合推出HO-Cap方案,通过低成本RGB-D相机和AR头显,结合半自动化AI标注流水线,实现了高精度手-物交互数据采集。配套开源数据集包含65.6万帧RGB-D图像,覆盖64个日常物体和多种交互场景,大幅降低人机交互、VR/AR和机器人操作研究门槛。
人形机器人跑动作业兼顾,稳如老狗的秘密
本文介绍了佐治亚理工学院与清华大学研究团队提出的SEEC稳定末端执行器控制框架,该框架成功解决了人形机器人在动态行走时难以保持精准操作的核心难题。通过模型增强残差学习、扰动生成策略和模块化设计,SEEC让机器人能够在行走中稳定执行端盘、握持等任务,性能超越传统方法,实现了移动与操作的高效解耦与零样本适配。
IJRR北邮首篇,联合三星中国研究院、清华大学等共同探讨“机器人操作大模型”
北京邮电大学联合三星中国研究院、清华大学等机构在IJRR发表首篇机器人操作大模型综述,探讨基础模型如何解决机器人通用操作面临的七大挑战。文章系统分析了LLMs、VFMs、VLMs等基础模型在机器人交互、感知、决策等关键环节的应用潜力,并提出从L0级别逐步实现通用操作的框架路径,为机器人学习领域提供重要理论指导。
Science Robotics 顶刊综述:Learning-based 动力学模型,如何破解机器人复杂操作难题?
本文基于Science Robotics综述文章,系统探讨了学习型动力学模型(LBDMs)如何帮助机器人掌握复杂操作能力。文章分析了感知、动力学和控制三大核心模块,介绍了从像素级到潜变量等五种状态表示方法,揭示了机器人如何通过数据驱动方式学习物理直觉,实现从‘看-想-动’的完整闭环,为解决机器人复杂操作难题提供了新思路。
地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军,双臂机器人操作实现新突破!
地平线机器人实验室与清华大学联合研发的H-RDT模型在CVPR 2025 RoboTwin双臂机器人竞赛中荣获真机赛冠军。该模型基于20亿参数扩散Transformer架构,通过人类操作视频预训练和跨本体迁移技术,实现了双臂机器人在柔性物体操作、双手协作等复杂任务上的突破性表现,平均成功率高达87.2%,为通用机器人操作技能学习提供了新范式。