TAG:人工智能评测

开源模型评测超越GPT-4 具身智能迎来突破时刻

文章报道了自变量开源端到端具身智能基础模型WALL-OSS在RoboChallenge评测中超越pi0，排名第二，并在多个单动作任务中位列第一。文章探讨了开源模型在推动具身智能产业生态繁荣、降低行业创新成本以及加速技术落地方面的关键作用，分析了其彻底开源策略对行业发展的深远意义。

OFweek机器人网

2026-01-12 18:44

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

SuperCLUE-VLM发布2025年12月多模态视觉语言模型评测榜单，谷歌Gemini-3-Pro以83.64分断层领先。国产模型中，商汤SenseNova V6.5Pro和字节豆包大模型表现亮眼，分别位列第二、第三。阿里Qwen3-VL成为首个总分突破70分的开源模型，推动技术民主化。榜单揭示了多模态竞赛进入实用化新阶段，视觉推理仍是关键瓶颈。

aibase

2025-12-31 11:36

通知

尊敬的用户

user

TAG:人工智能评测

开源模型评测超越GPT-4 具身智能迎来突破时刻

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

快讯

鑫源汽车与白犀牛合资落地联手打造无人驾驶厢式车抢滩万亿无人配送市场

3月汽车产销回暖环比大涨74.4% 新能源车出口增长1.3倍

睿尔曼发布全球首个官方AI原生机械臂，构建从开发层到服务层的AI全链路智能体验

发布龙虾湖+词元工厂联想中国基础设施业务加速打造企业AI标杆方案

工信部：加快构建高效统一的人工智能芯片计算互联生态，坚决破除光伏行业“内卷式”竞争

3月PPI同比回正：芯片产业链价格上涨，光纤制造出厂价格同比上涨76.1%专家解读

中汽协：一季度汽车产销环比升同比降合资承压明显整体释放向好信号

阿里云押注世界模型，清华系AI公司生数科技完成近20亿元B轮融资

短剧行业震荡：红果合并真人与AI榜单，AI仿真人剧热度首次超过实拍剧

网易智企发布“帝王蟹”企业AI Agent产品，提升企业AI应用可控性与安全性

推荐专栏

爱力方

机器人大讲堂

user

TAG:人工智能评测

开源模型评测超越GPT-4 具身智能迎来突破时刻

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首 国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

快讯

鑫源汽车与白犀牛合资落地 联手打造无人驾驶厢式车 抢滩万亿无人配送市场

3月汽车产销回暖 环比大涨74.4% 新能源车出口增长1.3倍

睿尔曼发布全球首个官方AI原生机械臂，构建从开发层到服务层的AI全链路智能体验

发布龙虾湖+词元工厂 联想中国基础设施业务加速打造企业AI标杆方案

工信部：加快构建高效统一的人工智能芯片计算互联生态，坚决破除光伏行业“内卷式”竞争

3月PPI同比回正：芯片产业链价格上涨，光纤制造出厂价格同比上涨76.1%专家解读

中汽协：一季度汽车产销环比升同比降 合资承压明显 整体释放向好信号

阿里云押注世界模型，清华系AI公司生数科技完成近20亿元B轮融资

短剧行业震荡：红果合并真人与AI榜单，AI仿真人剧热度首次超过实拍剧

网易智企发布“帝王蟹”企业AI Agent产品，提升企业AI应用可控性与安全性

推荐专栏

爱力方

机器人大讲堂

多模态大模型最新评测结果公布 Gemini-3-Pro稳居榜首国产模型豆包、商汤表现亮眼 Qwen3-VL成为首个开源高分模型

鑫源汽车与白犀牛合资落地联手打造无人驾驶厢式车抢滩万亿无人配送市场

3月汽车产销回暖环比大涨74.4% 新能源车出口增长1.3倍

发布龙虾湖+词元工厂联想中国基础设施业务加速打造企业AI标杆方案

中汽协：一季度汽车产销环比升同比降合资承压明显整体释放向好信号