TAG:人工智能评测

开源模型评测超越GPT-4 具身智能迎来突破时刻

开源模型评测超越GPT-4 具身智能迎来突破时刻

文章报道了自变量开源端到端具身智能基础模型WALL-OSS在RoboChallenge评测中超越pi0,排名第二,并在多个单动作任务中位列第一。文章探讨了开源模型在推动具身智能产业生态繁荣、降低行业创新成本以及加速技术落地方面的关键作用,分析了其彻底开源策略对行业发展的深远意义。

2026-01-12 18:44
6
0

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

SuperCLUE-VLM发布2025年12月多模态视觉语言模型评测榜单,谷歌Gemini-3-Pro以83.64分断层领先。国产模型中,商汤SenseNova V6.5Pro和字节豆包大模型表现亮眼,分别位列第二、第三。阿里Qwen3-VL成为首个总分突破70分的开源模型,推动技术民主化。榜单揭示了多模态竞赛进入实用化新阶段,视觉推理仍是关键瓶颈。

2025-12-31 11:36
10
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/