TAG:多模态学习

仅0.77B参数碾压3.5B大模型！上海交大Evo-1刷新VLA模型纪录，集成lerobot框架可用于SO100/SO101部署

上海交大Evo-1模型仅用0.77B参数在机器人VLA领域实现突破，无需机器人数据预训练即可超越3.5B大模型性能。该模型通过轻量化设计、16.4Hz高推理频率和创新训练范式，解决了参数臃肿、实时性不足、泛化能力弱和数据依赖四大核心问题，已集成lerobot框架支持SO100/SO101部署，为消费级GPU上的机器人智能操控提供高效解决方案。

具身智能大讲堂

2025-11-17 12:07

最火VLA，看这一篇综述就够了

这篇综述全面解析了ICLR 2026爆火领域VLA（视觉-语言-动作）的最新进展。作者Moritz Reuss作为Apple AI/ML学者奖得主，系统阐述了VLA的核心概念、八大技术趋势，包括离散扩散模型、具身思维链、动作分词器等关键突破。文章还厘清了VLA与LBM的区别，帮助读者深入理解这一让机器人&#039;听懂人话、看懂世界、动手干活&#039;的前沿技术。

量子位

2025-11-01 18:38

阿里新研究：统一了VLA和世界模型

阿里巴巴达摩院联合浙江大学提出WorldVLA框架，首次将视觉语言动作模型与世界模型相统一。该框架通过三套独立分词器处理图像、文本和动作，采用创新的注意力掩码设计，实现了动作生成与视觉理解的相互增强。实验证明WorldVLA在机器人操作任务中显著优于独立模型，为具身智能发展提供了新思路。

量子位

2025-10-30 12:02

字节提出Robix大模型！三阶训练+统一架构，打破机器人认知瓶颈，真实场景任务完成率领先

字节跳动Seed团队推出Robix大模型，通过三阶训练和统一架构打破机器人认知瓶颈。该模型将视觉、语言和行动规划整合于单一架构，支持动态环境中的理解-决策-响应闭环，实现真实场景下的多轮对话和任务中断处理。实验显示在3D空间理解、任务规划和真实场景执行方面领先GPT-4o等模型，任务完成率显著提升。

机器人大讲堂

2025-09-21 12:15

通知

尊敬的用户

user

TAG:多模态学习

仅0.77B参数碾压3.5B大模型！上海交大Evo-1刷新VLA模型纪录，集成lerobot框架可用于SO100/SO101部署

最火VLA，看这一篇综述就够了

阿里新研究：统一了VLA和世界模型

字节提出Robix大模型！三阶训练+统一架构，打破机器人认知瓶颈，真实场景任务完成率领先

快讯

消费者购车洽谈遭录音奥迪门店称厂家要求折射经销商返利考核压力

2026年大模型GEO优化服务商标杆企业推荐精选

马云谈AI时代胜负关键：不在芯片在心跳阿里核心高管齐聚云谷论教育

2026年GEO优化服务商Top3推荐：商家AI搜索流量布局指南

中国AI产品创新提速美图RoboNeo登顶巴西App Store分类榜

全国人大代表吴丰礼：建议试点粤港澳大湾区AI制度创新，夯实具身智能工业数据基建

头部酒企新春首课聚焦AI：不转型就出局

千问持续投入AI办事春节完成2亿笔真实订单

追觅科技在浙江新设智能科技公司，注册资本2000万元

霍尔木兹海峡受阻丰田被迫减产4万辆汽车

推荐专栏

爱力方

机器人大讲堂

user

TAG:多模态学习

仅0.77B参数碾压3.5B大模型！上海交大Evo-1刷新VLA模型纪录，集成lerobot框架可用于SO100/SO101部署

最火VLA，看这一篇综述就够了

阿里新研究：统一了VLA和世界模型

字节提出Robix大模型！三阶训练+统一架构，打破机器人认知瓶颈，真实场景任务完成率领先

快讯

消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力

2026年大模型GEO优化服务商标杆企业推荐精选

马云谈AI时代胜负关键：不在芯片在心跳 阿里核心高管齐聚云谷论教育

2026年GEO优化服务商Top3推荐：商家AI搜索流量布局指南

中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜

全国人大代表吴丰礼：建议试点粤港澳大湾区AI制度创新，夯实具身智能工业数据基建

头部酒企新春首课聚焦AI：不转型就出局

千问持续投入AI办事 春节完成2亿笔真实订单

追觅科技在浙江新设智能科技公司，注册资本2000万元

霍尔木兹海峡受阻 丰田被迫减产4万辆汽车

推荐专栏

爱力方

机器人大讲堂

消费者购车洽谈遭录音奥迪门店称厂家要求折射经销商返利考核压力

马云谈AI时代胜负关键：不在芯片在心跳阿里核心高管齐聚云谷论教育

中国AI产品创新提速美图RoboNeo登顶巴西App Store分类榜

千问持续投入AI办事春节完成2亿笔真实订单

霍尔木兹海峡受阻丰田被迫减产4万辆汽车