TAG:模型评估

你的模型真能举一反三吗 RoboChallenge Table30 V2 正式发布开启泛化时代

你的模型真能举一反三吗 RoboChallenge Table30 V2 正式发布开启泛化时代

RoboChallenge Table30 V2 正式发布，作为全球首个大规模真机评测平台，旨在解决具身智能模型在真实场景中的泛化能力问题。通过任务升级、评测升级和系统升级，Table30 V2 引入了更严苛的软体操作、工具使用及双臂协作任务，支持零样本与域外泛化测试，为研究者提供精准的泛化能力评估工具。

机器人大讲堂

2026-03-25 11:20

0

·

0

快讯

科创芯片ETF嘉实半日成交超20亿元 5只绿电ETF半日涨超3%

2026-03-25

·

0 浏览

谷歌最强轻量模型Gemini 3.1曝光实时渲染UI惊艳亮相

2026-03-25

·

0 浏览

多个社交平台禁关官方账号汽车之家辟谣网传车辆测试内容

2026-03-25

·

0 浏览

芯驰科技以场景引领深度协同打造高性能车规芯片软硬件一体化平台新范式

2026-03-25

·

0 浏览

山西省首部AI微短剧《蚀影密符》登陆IMAX巨幕厅

2026-03-25

·

0 浏览

前沿科技赋能AI旗舰三星Galaxy S26系列媒体体验沙龙在沈阳举办

2026-03-25

·

0 浏览

卓视智通完成B2轮融资，推动物理AI加速赋能千行百业

2026-03-25

·

0 浏览

你的模型真能举一反三吗 RoboChallenge Table30 V2 正式发布开启泛化时代

2026-03-25

·

0 浏览

法官质疑美政府报复Anthropic AI监管是否沦为政治清算

2026-03-25

·

0 浏览

AI圈现教科书级投毒：Karpathy发帖警告，千万级神库litellm遭殃

2026-03-25

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/

浙ICP备2025176963号-1

标签云 RSS订阅滚动资讯资讯排行