TAG:Agentic-VLM

商汤开源新模型 赋予AI自主思考与行动能力

商汤开源新模型 赋予AI自主思考与行动能力

商汤科技开源了首个支持动态视觉推理与图文搜索深度融合的Agentic VLM模型SenseNova-MARS,包含8B和32B版本。该模型模拟侦探破案逻辑,实现AI从理解到自主执行的跨越,在多项基准测试中超越GPT-5.2,具备图像细节裁剪、动态图文搜索和多跳深度推理等核心能力。通过双阶段训练,模型展现出强大的自主规划与工具协同潜力,助力全球开发者探索具身智能。

2026-01-30 15:11
0
0