TAG:人工智能技术
字节跳动发布StoryMem系统 解决AI视频角色一致性难题
字节跳动与南洋理工大学联合推出StoryMem系统,通过存储关键帧并在后续场景生成时参考,有效解决了AI视频生成中角色外观和环境不一致的问题。该系统在跨场景一致性上比现有模型提升了28.7%,用户调查显示其在美观性和一致性方面表现更佳,但处理复杂多角色场景时仍需优化提示描述。
字节跳动推出StoryMem技术 解决AI视频角色走样问题
字节跳动与南洋理工大学联合推出StoryMem系统,通过创新的“混合记忆库”设计,为AI视频生成提供长期记忆能力,有效解决了角色走样和环境闪烁的行业难题。该系统基于高效算法,在保持角色形象和背景细节跨场景一致性的同时,显著提升了视频生成质量,已在开源平台发布供开发者使用。
智谱开源周落幕 四项视频生成技术开放
智谱多模态开源周圆满落幕,团队开源了四项视频生成核心技术:SCAIL、RealVideo、Kaleido和SSVAE。这些技术分别针对影视级角色动画生成、实时流式视频生成、多主体一致性生成以及训练效率优化,旨在解决视频生成领域的关键难题,推动AI视频技术的发展与创新。
苹果发布STARFlow-V 革新视频生成技术
苹果公司推出创新视频生成模型STARFlow-V,采用归一化流技术替代主流扩散模型,显著提升长视频生成的稳定性和训练效率。该模型支持文本转视频、图像转视频及视频编辑等多种任务,通过双重架构优化时间序列与单帧细节,在自回归模型中表现优异。未来苹果将继续优化计算速度和物理准确性,推动视频生成技术发展。
字节发布Seedream 4.5 图像生成实现多图一致性
字节跳动Seed团队发布Seedream 4.5,重点突破多图场景一致性和美学指令遵循两大核心能力。新版本解决了AI图像生成中角色、服饰、光影在多图中不一致的痛点,实现了批量生成的高度统一,同时在复杂风格描述下精准控制画面质感,为电商、IP设计等商业场景提供强大支持。
我国2025年人形机器人产品发布超330款
2026-01-21
0 浏览
工信部将发布人形机器人与具身智能标准化建设指南
2026-01-21
0 浏览
马斯克重启特斯拉Dojo3芯片项目,瞄准太空AI发展
2026-01-21
0 浏览
人形机器人为何难以突破灵巧手技术难关
2026-01-21
0 浏览
中国AI厂商加速拓展国际市场,全球份额持续攀升
2026-01-21
0 浏览
Block推出开源AI编程助手Goose,应对Claude Code痛点
2026-01-21
0 浏览
工信部:新能源汽车与光伏等行业竞争环境持续优化
2026-01-21
0 浏览
清华两名室友联手打造吸金超2亿元的机器人
2026-01-21
0 浏览
江苏企业获批牵头建设农业农村部智能采收机器人重点实验室
2026-01-21
0 浏览
政策产业共振推升机器人股 微创机器人盘中大涨16%
2026-01-21
0 浏览