TAG:音画同步
开源版Veo 3登场:LTX-2发布,20秒4K音画同步AI视频本地可生成
Lightricks团队开源LTX-2模型,这是一个支持一次性生成长达20秒4K高清视频的完整音视频基础模型,实现了画面、声音与口型的完美同步。模型权重和代码已全部开源,支持本地部署,在消费级显卡上即可流畅运行,大幅降低了AI视频创作的门槛。
Seedance 1.5 Pro上线火山方舟 推出全新AI视频生成技术
Seedance 1.5 Pro正式上线火山方舟,带来AI视频生成技术的重大革新。该模型在音画同步、多语言对白配音和影视级叙事张力方面表现突出,支持毫秒级音画同步和原生音效生成,显著提升视频质量和创作效率。适用于电商、广告、影视等多个领域,助力创作者实现高质量内容生产。
千问APP融合万相Wan2.5 视频功能全面进化
千问APP接入阿里万相Wan2.5模型,视频创作能力全面升级,成为首个支持音视频同步输出的移动端AI助手。用户只需一张照片和一段文字,即可生成1080P高清、动作自然的唱跳视频,最长10秒,大幅降低创作门槛并激发用户创意。
Character AI联合耶鲁大学发布Ovi:实现音画同步的视频生成模型
Character AI与耶鲁大学联合推出开源项目Ovi,这是一项革命性的音画同步视频生成技术。通过创新的双骨干交叉模态融合架构,Ovi实现了音频和视频的并行处理与实时交互,彻底解决了传统方法中音画不同步的问题。该技术采用扩散变换器架构和旋转位置嵌入技术,确保嘴唇运动与发音等细节的精确匹配,为高质量视频生成提供了全新解决方案。
互联网
2025-11-14 10:53
我国2025年人形机器人产品发布超330款
2026-01-21
0 浏览
工信部将发布人形机器人与具身智能标准化建设指南
2026-01-21
0 浏览
马斯克重启特斯拉Dojo3芯片项目,瞄准太空AI发展
2026-01-21
0 浏览
人形机器人为何难以突破灵巧手技术难关
2026-01-21
0 浏览
中国AI厂商加速拓展国际市场,全球份额持续攀升
2026-01-21
0 浏览
Block推出开源AI编程助手Goose,应对Claude Code痛点
2026-01-21
0 浏览
工信部:新能源汽车与光伏等行业竞争环境持续优化
2026-01-21
0 浏览
清华两名室友联手打造吸金超2亿元的机器人
2026-01-21
0 浏览
江苏企业获批牵头建设农业农村部智能采收机器人重点实验室
2026-01-21
0 浏览
政策产业共振推升机器人股 微创机器人盘中大涨16%
2026-01-21
0 浏览