TAG:视觉语言导航

上海人工智能实验室推出DualVLN,机器人视觉语言导航成功率提升至70.7%

上海人工智能实验室推出DualVLN,机器人视觉语言导航成功率提升至70.7%

上海人工智能实验室提出的DualVLN框架,通过解耦高层语义推理与低层运动控制,采用‘慢思考、快行动’的双系统架构,显著提升了机器人视觉语言导航的性能。该方案在VLN-CE等基准测试中取得70.7%的导航成功率,刷新纪录,并在动态行人场景中展现出强大的稳健性和避障能力,推动机器人导航向现实应用迈进。

2025-12-31 17:22
2
0

群核科技携手浙大开源首个3D高斯VLN具身学习数据集

群核科技携手浙大开源首个3D高斯VLN具身学习数据集

群核科技与浙江大学联合开源SAGE-3D数据集,这是首个基于3D高斯的视觉语言导航(VLN)具身学习数据集。该数据集包含1000个场景、超过55.4万个对象实例的语义与碰撞体数据,以及200万条轨迹-指令对,为3D高斯环境赋予语义理解和物理感知能力,推动具身智能与导航技术发展。

2025-12-26 17:41
0
0

深大团队提升机器人导航成功率至72.5%

深大团队提升机器人导航成功率至72.5%

深圳大学李坚强教授团队联合多所高校提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制,让机器人能预测未来视觉状态并做出更智能的导航决策。该框架在资源消耗大幅降低的同时,在未知环境中的导航成功率可达72.5%,推理效率提升40%,尤其在长轨迹导航中表现突出,相关论文已入选AAAI2026。

2025-12-10 15:41
7
0