TAG:多模态生成

告别视频扭曲与“AI电音”:巨人网络多模态模型让虚拟世界更真实

告别视频扭曲与“AI电音”:巨人网络多模态模型让虚拟世界更真实

巨人网络AI Lab联合清华大学和西北工业大学发布三项多模态生成技术:YingVideo-MV实现音乐驱动视频生成并消除人物畸变,YingMusic-SVC提供零样本歌声转换确保真实歌曲可用,YingMusic-Singer支持任意歌词生成自然歌声。这些开源技术显著提升了音视频创作的质量与灵活性。

爱力方 2025-11-27 15:41
0
0

李飞飞World Labs放大招!Marble 3D世界模型公测,文本/图片秒变可交互虚拟宇宙

李飞飞World Labs放大招!Marble 3D世界模型公测,文本/图片秒变可交互虚拟宇宙

李飞飞World Labs推出Marble 3D世界模型公测版,支持从文本、图像、视频等多模态输入直接生成完整可交互的3D虚拟世界。用户可实时编辑导航,10分钟内创建风格多样的沉浸式环境,并导出高斯溅射、三角网格等多种格式。这一突破性工具将重塑游戏开发、VR/影视制作和AI训练等领域,推动从2D生成向3D空间智能的跨越。

2025-11-13 17:42
0
0