TAG:视觉推理
商汤开源新模型 赋予AI自主思考与行动能力
商汤科技开源了首个支持动态视觉推理与图文搜索深度融合的Agentic VLM模型SenseNova-MARS,包含8B和32B版本。该模型模拟侦探破案逻辑,实现AI从理解到自主执行的跨越,在多项基准测试中超越GPT-5.2,具备图像细节裁剪、动态图文搜索和多跳深度推理等核心能力。通过双阶段训练,模型展现出强大的自主规划与工具协同潜力,助力全球开发者探索具身智能。
硅基生物的视觉推理能力受限:顶级大模型竟不如6岁孩童?
最新研究揭示,顶级大模型如Gemini 3 Pro Preview的视觉推理能力仅略胜三岁幼儿,面对六岁儿童仍有20%差距。研究指出,大模型依赖语言描述处理视觉信息,导致在精细细节、空间想象等任务上表现不佳,暴露了AI在物理世界感知的短板。文章探讨了视觉推理的瓶颈及具身智能的发展方向。
月之暗面新模型Kiwi-do亮相 AI界震动
月之暗面在完成35亿融资后,其神秘新模型“Kiwi-do”在LmArena平台亮相,训练数据截至2025年1月,在视觉物理推理测试中表现卓越,被猜测为多模态模型K2-VL。该模型展示了强大的视觉与语言融合能力,预计将推动文档解析、仪表盘分析等商业应用,引发AI界广泛关注。
智谱AI发布道歉及补偿方案
2026-02-22
0 浏览
2026年机器人技术风口或将聚焦VLX与灵巧操控
2026-02-22
0 浏览
日本网友嘲讽中国除冰机器人 中国网友回以“夏虫不可语冰”
2026-02-22
0 浏览
具身智能如何跨越规模化生死线?
2026-02-22
0 浏览
机器人产业从春晚展示到落地应用,价值之路如何突破?
2026-02-22
0 浏览
SK海力士预测AI浪潮将推动内存价格持续上涨
2026-02-22
0 浏览
春节科技热:AI产品领跑新年“电子年货”销售
2026-02-22
0 浏览
SK海力士高盛电话会:客户需求无法全部满足 存储价格持续上涨
2026-02-22
0 浏览
光谷重点企业春节不停工 AI光模块订单延续至四季度
2026-02-22
0 浏览
购车为何多推荐7年分期付款?
2026-02-22
0 浏览