TAG:研究

硅基生物的视觉推理能力受限:顶级大模型竟不如6岁孩童?

硅基生物的视觉推理能力受限:顶级大模型竟不如6岁孩童?

最新研究揭示,顶级大模型如Gemini 3 Pro Preview的视觉推理能力仅略胜三岁幼儿,面对六岁儿童仍有20%差距。研究指出,大模型依赖语言描述处理视觉信息,导致在精细细节、空间想象等任务上表现不佳,暴露了AI在物理世界感知的短板。文章探讨了视觉推理的瓶颈及具身智能的发展方向。

2026-01-23 16:05
0
0