TAG:计算机视觉

“一句话生成一个3D模型”:Meta发布SAM 3D,让所有人都成为创造者

“一句话生成一个3D模型”:Meta发布SAM 3D,让所有人都成为创造者

Meta AI发布革命性模型SAM3D,只需单张2D照片即可生成带纹理、材质与几何一致性的3D模型。该模型提供通用物体和人像重建两套权重,在真实世界图像上显著优于现有NeRF与Gaussian Splatting方案,Chamfer Distance降低28%,法向一致性提升19%。支持AR/VR、机器人及影视后期应用,已集成至Quest3并开放API调用。

爱力方 2025-11-20 16:14
0
0

字节发布InfinityStar框架:视频生成效率提升至58秒

字节发布InfinityStar框架:视频生成效率提升至58秒

字节跳动推出InfinityStar框架,将5秒720p视频生成时间缩短至仅58秒,显著提升视频生成效率。该框架采用时空金字塔模型,有效解耦外观与运动信息,提高生成质量,并通过知识继承策略降低训练成本。支持图像生成、文本生成视频等多种视觉任务,标志着视觉生成技术的重要进步。

2025-11-12 11:20
0
0

五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!

五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!

五校联合研究团队开发出DeSa2VA框架,通过解耦增强提示技术解决多模态分割中的模态鸿沟问题。该框架将MLLM隐藏状态显式解耦为文本和视觉表征,采用文本-视觉对齐训练和动态掩码融合方案,显著提升了图像、视频分割及视觉问答任务的准确性与鲁棒性,为计算机视觉领域提供了新的技术突破。

2025-10-28 16:17
9
0

阿米奥冯骞团队提出LensDFF方案:仅需单视角演示,机器人实现灵巧抓取新突破

阿米奥冯骞团队提出LensDFF方案:仅需单视角演示,机器人实现灵巧抓取新突破

阿米奥冯骞团队提出LensDFF创新方案,通过语言增强的稀疏特征蒸馏技术,让机器人仅需单视角演示就能实现高灵巧度抓取。该方案结合语言特征对齐、五种抓取原语驱动和Real2Sim评估流水线三大创新,有效解决了传统方法的多视角依赖和计算效率问题,在仿真和真实场景中均展现出优异的抓取成功率。

2025-10-24 17:31
0
0

​字节跳动Seed团队宣布推出3D生成大模型Seed 3D 1.0

​字节跳动Seed团队宣布推出3D生成大模型Seed 3D 1.0

字节跳动Seed团队推出3D生成大模型Seed3D1.0,该模型能够从单张图像端到端生成高质量仿真级3D模型,包含精细几何、真实纹理和PBR材质。采用Diffusion Transformer架构,在几何生成、纹理一致性和材质准确性方面表现优异,超越业界同类模型。这一技术为具身智能提供强大的世界模拟器支持,推动机器人训练和交互式学习发展。

2025-10-23 15:41
0
0

单块GPU上跑出实时3D宇宙,李飞飞世界模型新成果震撼问世

单块GPU上跑出实时3D宇宙,李飞飞世界模型新成果震撼问世

斯坦福李飞飞团队推出实时3D世界模型RTFM,可在单块H100 GPU上运行。该模型通过2D图像输入直接生成多视角新图像,无需显式3D建模,实现了实时、持续的3D一致性渲染。作为学习型渲染器,RTFM融合了重建与生成功能,能处理光照、反射等复杂视觉效果,标志着空间智能领域的重大突破。

2025-10-17 15:47
0
0

让机器“看懂”物体如何摆放:单视图3D生成新框架,解决机器人空间感知核心难题

让机器“看懂”物体如何摆放:单视图3D生成新框架,解决机器人空间感知核心难题

OnePoseViaGen创新框架,通过单视图3D生成技术解决机器人6D位姿估计的核心难题。该技术仅需一张参考图像即可精确估计未知物体的3D位置和姿态,突破传统方法在尺度模糊、背景干扰等限制,在工业分拣、AR应用和自动驾驶等领域具有重要价值。实验显示其精度达81.27%,并在真实机器人任务中验证了强鲁棒性。

2025-10-03 19:42
6
0

跨维智能携Sim2Real技术亮相2025上海工博会,开启具身智能工业新纪元

跨维智能携Sim2Real技术亮相2025上海工博会,开启具身智能工业新纪元

跨维智能在2025上海工博会上展示了Sim2Real技术如何推动具身智能工业发展。通过人形机器人咖啡师演示、反光透明件视觉解决方案、深框无序上下料和混合拆码垛工作站,以及四目相机感知技术,展现了虚拟仿真与现实工业的闭环能力。这些创新技术为工业制造带来了感知-决策-执行全链路的革新,预示着智能制造的新纪元。

2025-09-24 10:16
44
0

虹软科技布局具身智能,与知名机器人公司合作

虹软科技布局具身智能,与知名机器人公司合作

虹软科技作为全球领先的视觉人工智能企业,专注于计算机视觉算法技术研发,拥有包括人脸识别、手势识别、3D重建和SLAM等多项核心算法。公司积极布局具身智能机器人领域,已与全球知名民用机器人公司建立技术合作,推动智能视觉感知与融合技术的创新应用。

2025-08-29 12:10
0
0