TAG:DeSa2VA

五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!

五校联合发布!DeSa2VA 框架破解多模态分割模态鸿沟!

五校联合研究团队开发出DeSa2VA框架,通过解耦增强提示技术解决多模态分割中的模态鸿沟问题。该框架将MLLM隐藏状态显式解耦为文本和视觉表征,采用文本-视觉对齐训练和动态掩码融合方案,显著提升了图像、视频分割及视觉问答任务的准确性与鲁棒性,为计算机视觉领域提供了新的技术突破。

2025-10-28 16:17
9
0