TAG:音画同步

开源版Veo 3登场:LTX-2发布,20秒4K音画同步AI视频本地可生成

开源版Veo 3登场:LTX-2发布,20秒4K音画同步AI视频本地可生成

Lightricks团队开源LTX-2模型,这是一个支持一次性生成长达20秒4K高清视频的完整音视频基础模型,实现了画面、声音与口型的完美同步。模型权重和代码已全部开源,支持本地部署,在消费级显卡上即可流畅运行,大幅降低了AI视频创作的门槛。

2026-01-07 18:21
29
0

Seedance 1.5 Pro上线火山方舟 推出全新AI视频生成技术

Seedance 1.5 Pro上线火山方舟 推出全新AI视频生成技术

Seedance 1.5 Pro正式上线火山方舟,带来AI视频生成技术的重大革新。该模型在音画同步、多语言对白配音和影视级叙事张力方面表现突出,支持毫秒级音画同步和原生音效生成,显著提升视频质量和创作效率。适用于电商、广告、影视等多个领域,助力创作者实现高质量内容生产。

2025-12-24 15:09
1
0

千问APP融合万相Wan2.5 视频功能全面进化

千问APP融合万相Wan2.5 视频功能全面进化

千问APP接入阿里万相Wan2.5模型,视频创作能力全面升级,成为首个支持音视频同步输出的移动端AI助手。用户只需一张照片和一段文字,即可生成1080P高清、动作自然的唱跳视频,最长10秒,大幅降低创作门槛并激发用户创意。

2025-12-02 16:59
10
0

Character AI联合耶鲁大学发布Ovi:实现音画同步的视频生成模型

Character AI联合耶鲁大学发布Ovi:实现音画同步的视频生成模型

Character AI与耶鲁大学联合推出开源项目Ovi,这是一项革命性的音画同步视频生成技术。通过创新的双骨干交叉模态融合架构,Ovi实现了音频和视频的并行处理与实时交互,彻底解决了传统方法中音画不同步的问题。该技术采用扩散变换器架构和旋转位置嵌入技术,确保嘴唇运动与发音等细节的精确匹配,为高质量视频生成提供了全新解决方案。

2025-11-14 10:53
3
0