TAG:基础模型
机器人的“楚门世界”:用第一视角视频喂养的AI,将永远活在人类的“主观现实”里
加州大学圣地亚哥分校团队开发Human0机器人操控基础模型,通过1000小时人类第一视角数据集PHSD和两阶段训练框架,解决了机器人泛化能力不足的问题。模型采用'野生场景+任务导向'数据组合,结合域对抗判别器技术,使机器人能够理解未见过的语言指令并通过少量演示快速学习新技能,在人形机器人实测中展现出优秀的适应性和性能。
IJRR北邮首篇,联合三星中国研究院、清华大学等共同探讨“机器人操作大模型”
北京邮电大学联合三星中国研究院、清华大学等机构在IJRR发表首篇机器人操作大模型综述,探讨基础模型如何解决机器人通用操作面临的七大挑战。文章系统分析了LLMs、VFMs、VLMs等基础模型在机器人交互、感知、决策等关键环节的应用潜力,并提出从L0级别逐步实现通用操作的框架路径,为机器人学习领域提供重要理论指导。
Generalist AI 发布 GEN-θ具身基础模型!70 亿参数突破机器人智能阈值!摒弃网络视频与仿真数据训练路径?!
Generalist AI发布的GEN-θ具身基础模型采用全新训练路径,摒弃网络视频与仿真数据,完全基于真实世界物理交互数据构建。该模型通过谐波推理实现思考与行动同步,支持跨平台部署,研究发现70亿参数是机器人习得物理常识的关键阈值。模型在16类任务验证中展现出稳定的性能提升,为机器人通用智能发展提供了突破性技术方案。
五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!
五校联合研究团队开发出DeSa2VA框架,通过解耦增强提示技术解决多模态分割中的模态鸿沟问题。该框架将MLLM隐藏状态显式解耦为文本和视觉表征,采用文本-视觉对齐训练和动态掩码融合方案,显著提升了图像、视频分割及视觉问答任务的准确性与鲁棒性,为计算机视觉领域提供了新的技术突破。
面对AI业务的困境,苹果选择了吃“回头草”
彭博社曾爆料苹果开发“Apple GPT”后否认,如今又对其产生兴趣。苹果成立新内部团队 AKI 打造类似 ChatGPT 体验,由前 Siri 开发主管领导。苹果股价下跌,华尔街认为其在 AI 竞赛中失利,CEO 库克强调 AI 重要性。基础模型团队负责人转投 Meta,苹果面临人才流失,AI 业务局势艰难,AKI 团队或为应急产物,以堵住果粉失望。