TAG:AI视频生成
谷歌Veo 3.1全面升级:多图一致、原生竖版、4K超分
谷歌Veo 3.1模型迎来重磅升级,核心聚焦于多图参考生视频功能,显著提升了人物、物体与背景的一致性表现。新增原生竖版输出和专业级4K超分能力,让AI视频生成更适配短视频平台与专业制作需求,标志着从演示工具向实用生产工具的跃升。
前Snap高管创AI视频公司Higgsfield融资成功 估值达13亿美元
前Snap高管创办的AI视频生成公司Higgsfield完成8000万美元增售,A轮融资总额达1.3亿美元,估值飙升至13亿美元,正式成为独角兽企业。公司用户数突破1500万,年度经常性收入达2亿美元,并正从个人创作工具转型为专业社交媒体营销平台,以拓展B端市场。
前Snap大将操盘,Higgsfield AI视频估值13亿年入2亿,增速领跑行业
Higgsfield 作为 AI 视频生成领域的明星初创公司,凭借前 Snap 高管 Alex Mashrabov 的操盘,在短短九个月内用户突破1500万,年收入跃升至2亿美元,估值达13亿美元。文章探讨了其从娱乐工具向专业商业平台的转型,以及伴随极致创作自由而来的内容合规挑战与伦理争议。
Vidu 推出AI一键生成MV功能,实现分钟级虚拟制片
Vidu视频大模型推出“一键生成MV”功能,通过多智能体系统实现全自动视频制作。用户只需提供音乐、参考图和简单指令,即可在分钟内获得高质量MV,大幅降低专业视频创作门槛。
谷歌发布Veo 3.1更新 支持原生竖屏视频 AI创作直达YouTube Shorts
谷歌发布Veo3.1视频生成模型重大更新,新增原生9:16竖屏视频生成功能,可直接适配YouTube Shorts、TikTok等社交平台。更新还增强了动态表现力与视觉一致性,支持通过参考图像生成更生动的角色表情,并优化了专业级高分辨率输出。功能已整合至Gemini应用及多个专业创作工具中。
AI赋能短剧创作 竖屏影像探索新范式
文章介绍了爱诗科技旗下AI视频生成平台拍我AI如何助力FIRST与小红书红镜短剧计划作品《贪吃蛇》,通过将实拍素材与AI生成内容深度结合,探索了“实拍打底+AI提效”的竖屏短剧创作新范式。该项目展示了AI在提升创作效率、控制成本及丰富视觉表现方面的优势,为中小预算短剧提供了工业化新路径。
Lightricks 开源AI视频模型LTX-2 支持20秒音视频一体化合成
以色列科技公司Lightricks开源了其最新AI视频模型LTX-2,该系统能够根据文本描述直接生成长达20秒的高清视频,并实现音画完全同步。通过双流并行计算架构和190亿参数,LTX-2突破了传统音画解耦流程,合成速度最高可达竞品的18倍,为内容创作者提供了高效、自主的视听内容生成工具。
开源版Veo 3登场:LTX-2发布,20秒4K音画同步AI视频本地可生成
Lightricks团队开源LTX-2模型,这是一个支持一次性生成长达20秒4K高清视频的完整音视频基础模型,实现了画面、声音与口型的完美同步。模型权重和代码已全部开源,支持本地部署,在消费级显卡上即可流畅运行,大幅降低了AI视频创作的门槛。
字节跳动发布StoryMem系统 解决AI视频角色一致性难题
字节跳动与南洋理工大学联合推出StoryMem系统,通过存储关键帧并在后续场景生成时参考,有效解决了AI视频生成中角色外观和环境不一致的问题。该系统在跨场景一致性上比现有模型提升了28.7%,用户调查显示其在美观性和一致性方面表现更佳,但处理复杂多角色场景时仍需优化提示描述。
字节跳动推出StoryMem技术 解决AI视频角色走样问题
字节跳动与南洋理工大学联合推出StoryMem系统,通过创新的“混合记忆库”设计,为AI视频生成提供长期记忆能力,有效解决了角色走样和环境闪烁的行业难题。该系统基于高效算法,在保持角色形象和背景细节跨场景一致性的同时,显著提升了视频生成质量,已在开源平台发布供开发者使用。
输入脚本秒生视频 字节开源StoryMem解决AI角色变脸问题
字节跳动与南洋理工大学联合开源StoryMem框架,通过创新的视觉记忆机制,将单镜头视频扩散模型转化为多镜头长视频故事讲述者。该框架能根据分镜脚本自动生成超过1分钟、角色与场景高度连贯的叙事视频,有效解决AI视频生成中的角色“变脸”和场景跳变问题,适用于广告、影视预制作和短视频创作等领域。
清华开源TurboDiffusion 实现AI视频秒级生成 提速最高200倍
清华大学TSAIL实验室与生数科技联合推出开源视频生成加速框架TurboDiffusion,通过集成SageAttention、稀疏线性注意力机制和时间步蒸馏技术,在保证视频质量的同时将AI视频生成速度提升100-200倍。实测显示,在RTX5090显卡上生成5秒视频仅需1.9秒,大幅降低了计算延迟和算力需求。该框架已开源并提供多种优化方案,适配消费级和工业级显卡,助力个人创作者与企业提升视频生产效率。
清华开源TurboDiffusion,AI视频生成提速200倍,消费级显卡可秒出大片
清华大学TSAIL实验室与生数科技联合开源TurboDiffusion框架,将AI视频扩散模型的推理速度提升100-200倍,实现从分钟级到秒级的实时生成。该技术通过8位量化、稀疏线性注意力等优化,在消费级显卡上也能流畅运行,大幅降低硬件门槛,推动AI视频创作进入新纪元。
爱诗科技联手BytePlus 加速AI视频一键生成
本文介绍了爱诗科技与BytePlus合作,通过机器学习平台MLP提升PixVerse AI视频生成模型的训练和推理效率,实现快速生成高质量短视频。文章还提到DataFinder数据分析平台帮助优化产品迭代,推动用户规模增长,展现了AI视频技术在娱乐创作中的创新应用。
Seedance 1.5 Pro上线火山方舟 推出全新AI视频生成技术
Seedance 1.5 Pro正式上线火山方舟,带来AI视频生成技术的重大革新。该模型在音画同步、多语言对白配音和影视级叙事张力方面表现突出,支持毫秒级音画同步和原生音效生成,显著提升视频质量和创作效率。适用于电商、广告、影视等多个领域,助力创作者实现高质量内容生产。