TAG:视觉推理
商汤开源新模型 赋予AI自主思考与行动能力
商汤科技开源了首个支持动态视觉推理与图文搜索深度融合的Agentic VLM模型SenseNova-MARS,包含8B和32B版本。该模型模拟侦探破案逻辑,实现AI从理解到自主执行的跨越,在多项基准测试中超越GPT-5.2,具备图像细节裁剪、动态图文搜索和多跳深度推理等核心能力。通过双阶段训练,模型展现出强大的自主规划与工具协同潜力,助力全球开发者探索具身智能。
硅基生物的视觉推理能力受限:顶级大模型竟不如6岁孩童?
最新研究揭示,顶级大模型如Gemini 3 Pro Preview的视觉推理能力仅略胜三岁幼儿,面对六岁儿童仍有20%差距。研究指出,大模型依赖语言描述处理视觉信息,导致在精细细节、空间想象等任务上表现不佳,暴露了AI在物理世界感知的短板。文章探讨了视觉推理的瓶颈及具身智能的发展方向。
月之暗面新模型Kiwi-do亮相 AI界震动
月之暗面在完成35亿融资后,其神秘新模型“Kiwi-do”在LmArena平台亮相,训练数据截至2025年1月,在视觉物理推理测试中表现卓越,被猜测为多模态模型K2-VL。该模型展示了强大的视觉与语言融合能力,预计将推动文档解析、仪表盘分析等商业应用,引发AI界广泛关注。
鑫源汽车与白犀牛合资落地 联手打造无人驾驶厢式车 抢滩万亿无人配送市场
2026-04-10
0 浏览
3月汽车产销回暖 环比大涨74.4% 新能源车出口增长1.3倍
2026-04-10
0 浏览
睿尔曼发布全球首个官方AI原生机械臂,构建从开发层到服务层的AI全链路智能体验
2026-04-10
0 浏览
发布龙虾湖+词元工厂 联想中国基础设施业务加速打造企业AI标杆方案
2026-04-10
0 浏览
工信部:加快构建高效统一的人工智能芯片计算互联生态,坚决破除光伏行业“内卷式”竞争
2026-04-10
0 浏览
3月PPI同比回正:芯片产业链价格上涨,光纤制造出厂价格同比上涨76.1%专家解读
2026-04-10
0 浏览
中汽协:一季度汽车产销环比升同比降 合资承压明显 整体释放向好信号
2026-04-10
0 浏览
阿里云押注世界模型,清华系AI公司生数科技完成近20亿元B轮融资
2026-04-10
0 浏览
短剧行业震荡:红果合并真人与AI榜单,AI仿真人剧热度首次超过实拍剧
2026-04-10
0 浏览
网易智企发布“帝王蟹”企业AI Agent产品,提升企业AI应用可控性与安全性
2026-04-10
0 浏览