TAG:视觉推理

商汤开源新模型赋予AI自主思考与行动能力

商汤开源新模型赋予AI自主思考与行动能力

商汤科技开源了首个支持动态视觉推理与图文搜索深度融合的Agentic VLM模型SenseNova-MARS，包含8B和32B版本。该模型模拟侦探破案逻辑，实现AI从理解到自主执行的跨越，在多项基准测试中超越GPT-5.2，具备图像细节裁剪、动态图文搜索和多跳深度推理等核心能力。通过双阶段训练，模型展现出强大的自主规划与工具协同潜力，助力全球开发者探索具身智能。

2026-01-30 15:11

14

·

0

硅基生物的视觉推理能力受限：顶级大模型竟不如6岁孩童？

硅基生物的视觉推理能力受限：顶级大模型竟不如6岁孩童？

最新研究揭示，顶级大模型如Gemini 3 Pro Preview的视觉推理能力仅略胜三岁幼儿，面对六岁儿童仍有20%差距。研究指出，大模型依赖语言描述处理视觉信息，导致在精细细节、空间想象等任务上表现不佳，暴露了AI在物理世界感知的短板。文章探讨了视觉推理的瓶颈及具身智能的发展方向。

2026-01-23 16:05

8

·

0

月之暗面新模型Kiwi-do亮相 AI界震动

月之暗面新模型Kiwi-do亮相 AI界震动

月之暗面在完成35亿融资后，其神秘新模型“Kiwi-do”在LmArena平台亮相，训练数据截至2025年1月，在视觉物理推理测试中表现卓越，被猜测为多模态模型K2-VL。该模型展示了强大的视觉与语言融合能力，预计将推动文档解析、仪表盘分析等商业应用，引发AI界广泛关注。

2026-01-05 17:38

20

·

0

快讯

鑫源汽车与白犀牛合资落地联手打造无人驾驶厢式车抢滩万亿无人配送市场

2026-04-10

·

0 浏览

3月汽车产销回暖环比大涨74.4% 新能源车出口增长1.3倍

2026-04-10

·

0 浏览

睿尔曼发布全球首个官方AI原生机械臂，构建从开发层到服务层的AI全链路智能体验

2026-04-10

·

0 浏览

发布龙虾湖+词元工厂联想中国基础设施业务加速打造企业AI标杆方案

2026-04-10

·

0 浏览

工信部：加快构建高效统一的人工智能芯片计算互联生态，坚决破除光伏行业“内卷式”竞争

2026-04-10

·

0 浏览

3月PPI同比回正：芯片产业链价格上涨，光纤制造出厂价格同比上涨76.1%专家解读

2026-04-10

·

0 浏览

中汽协：一季度汽车产销环比升同比降合资承压明显整体释放向好信号

2026-04-10

·

0 浏览

阿里云押注世界模型，清华系AI公司生数科技完成近20亿元B轮融资

2026-04-10

·

0 浏览

短剧行业震荡：红果合并真人与AI榜单，AI仿真人剧热度首次超过实拍剧

2026-04-10

·

0 浏览

网易智企发布“帝王蟹”企业AI Agent产品，提升企业AI应用可控性与安全性

2026-04-10

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/

浙ICP备2025176963号-1

标签云 RSS订阅滚动资讯资讯排行