TAG:人工智能评测

开源模型评测超越GPT-4 具身智能迎来突破时刻

开源模型评测超越GPT-4 具身智能迎来突破时刻

文章报道了自变量开源端到端具身智能基础模型WALL-OSS在RoboChallenge评测中超越pi0,排名第二,并在多个单动作任务中位列第一。文章探讨了开源模型在推动具身智能产业生态繁荣、降低行业创新成本以及加速技术落地方面的关键作用,分析了其彻底开源策略对行业发展的深远意义。

2026-01-12 18:44
0
0

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

SuperCLUE-VLM发布2025年12月多模态视觉语言模型评测榜单,谷歌Gemini-3-Pro以83.64分断层领先。国产模型中,商汤SenseNova V6.5Pro和字节豆包大模型表现亮眼,分别位列第二、第三。阿里Qwen3-VL成为首个总分突破70分的开源模型,推动技术民主化。榜单揭示了多模态竞赛进入实用化新阶段,视觉推理仍是关键瓶颈。

2025-12-31 11:36
0
0