TAG:空间理解

机器人感知大升级!轻量化注入几何先验,成功率提升31%

机器人感知大升级!轻量化注入几何先验,成功率提升31%

上海交通大学与剑桥大学联合提出Evo-0方法,通过隐式注入3D几何先验增强机器人视觉语言动作模型的空间理解能力。该方法利用VGGT模型从多视角RGB图像提取3D结构信息,无需额外传感器或深度输入,在仿真实验中成功率提升31%,真实世界操作任务成功率提升28.88%,显著提升了机器人对空间结构和物体布局的感知精度。

2025-09-29 20:38
6
0