TAG:多模态分割
五校联手推出DeSa2VA框架,攻克多模态分割难题
五校联合团队推出的DeSa2VA框架解决了多模态分割中的模态鸿沟问题。文章重点介绍了HO-Cap解决方案,它通过低成本RGB-D相机和AR头显,结合半自动化AI标注流程,高效生成高精度手-物交互3D数据。配套开源的HO-Cap数据集包含65.6万帧数据,覆盖多种日常物体和交互场景,大幅降低了相关研究门槛,并可直接用于机器人操作、VR/AR等领域的训练与测试。
五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!
五校联合研究团队开发出DeSa2VA框架,通过解耦增强提示技术解决多模态分割中的模态鸿沟问题。该框架将MLLM隐藏状态显式解耦为文本和视觉表征,采用文本-视觉对齐训练和动态掩码融合方案,显著提升了图像、视频分割及视觉问答任务的准确性与鲁棒性,为计算机视觉领域提供了新的技术突破。
我国2025年人形机器人产品发布超330款
2026-01-21
0 浏览
工信部将发布人形机器人与具身智能标准化建设指南
2026-01-21
0 浏览
马斯克重启特斯拉Dojo3芯片项目,瞄准太空AI发展
2026-01-21
0 浏览
人形机器人为何难以突破灵巧手技术难关
2026-01-21
0 浏览
中国AI厂商加速拓展国际市场,全球份额持续攀升
2026-01-21
0 浏览
Block推出开源AI编程助手Goose,应对Claude Code痛点
2026-01-21
0 浏览
工信部:新能源汽车与光伏等行业竞争环境持续优化
2026-01-21
0 浏览
清华两名室友联手打造吸金超2亿元的机器人
2026-01-21
0 浏览
江苏企业获批牵头建设农业农村部智能采收机器人重点实验室
2026-01-21
0 浏览
政策产业共振推升机器人股 微创机器人盘中大涨16%
2026-01-21
0 浏览