TAG:人工智能技术

字节跳动发布StoryMem系统 解决AI视频角色一致性难题

字节跳动发布StoryMem系统 解决AI视频角色一致性难题

字节跳动与南洋理工大学联合推出StoryMem系统,通过存储关键帧并在后续场景生成时参考,有效解决了AI视频生成中角色外观和环境不一致的问题。该系统在跨场景一致性上比现有模型提升了28.7%,用户调查显示其在美观性和一致性方面表现更佳,但处理复杂多角色场景时仍需优化提示描述。

2026-01-04 14:38
8
0

字节跳动推出StoryMem技术 解决AI视频角色走样问题

字节跳动推出StoryMem技术 解决AI视频角色走样问题

字节跳动与南洋理工大学联合推出StoryMem系统,通过创新的“混合记忆库”设计,为AI视频生成提供长期记忆能力,有效解决了角色走样和环境闪烁的行业难题。该系统基于高效算法,在保持角色形象和背景细节跨场景一致性的同时,显著提升了视频生成质量,已在开源平台发布供开发者使用。

2026-01-04 11:24
1
0

智谱开源周落幕 四项视频生成技术开放

智谱开源周落幕 四项视频生成技术开放

智谱多模态开源周圆满落幕,团队开源了四项视频生成核心技术:SCAIL、RealVideo、Kaleido和SSVAE。这些技术分别针对影视级角色动画生成、实时流式视频生成、多主体一致性生成以及训练效率优化,旨在解决视频生成领域的关键难题,推动AI视频技术的发展与创新。

2025-12-12 11:03
6
0

苹果发布STARFlow-V 革新视频生成技术

苹果发布STARFlow-V 革新视频生成技术

苹果公司推出创新视频生成模型STARFlow-V,采用归一化流技术替代主流扩散模型,显著提升长视频生成的稳定性和训练效率。该模型支持文本转视频、图像转视频及视频编辑等多种任务,通过双重架构优化时间序列与单帧细节,在自回归模型中表现优异。未来苹果将继续优化计算速度和物理准确性,推动视频生成技术发展。

2025-12-08 11:35
2
0

字节发布Seedream 4.5 图像生成实现多图一致性

字节发布Seedream 4.5 图像生成实现多图一致性

字节跳动Seed团队发布Seedream 4.5,重点突破多图场景一致性和美学指令遵循两大核心能力。新版本解决了AI图像生成中角色、服饰、光影在多图中不一致的痛点,实现了批量生成的高度统一,同时在复杂风格描述下精准控制画面质感,为电商、IP设计等商业场景提供强大支持。

2025-12-04 12:14
8
0