TAG:人工智能技术
字节跳动发布StoryMem系统 解决AI视频角色一致性难题
字节跳动与南洋理工大学联合推出StoryMem系统,通过存储关键帧并在后续场景生成时参考,有效解决了AI视频生成中角色外观和环境不一致的问题。该系统在跨场景一致性上比现有模型提升了28.7%,用户调查显示其在美观性和一致性方面表现更佳,但处理复杂多角色场景时仍需优化提示描述。
字节跳动推出StoryMem技术 解决AI视频角色走样问题
字节跳动与南洋理工大学联合推出StoryMem系统,通过创新的“混合记忆库”设计,为AI视频生成提供长期记忆能力,有效解决了角色走样和环境闪烁的行业难题。该系统基于高效算法,在保持角色形象和背景细节跨场景一致性的同时,显著提升了视频生成质量,已在开源平台发布供开发者使用。
智谱开源周落幕 四项视频生成技术开放
智谱多模态开源周圆满落幕,团队开源了四项视频生成核心技术:SCAIL、RealVideo、Kaleido和SSVAE。这些技术分别针对影视级角色动画生成、实时流式视频生成、多主体一致性生成以及训练效率优化,旨在解决视频生成领域的关键难题,推动AI视频技术的发展与创新。
苹果发布STARFlow-V 革新视频生成技术
苹果公司推出创新视频生成模型STARFlow-V,采用归一化流技术替代主流扩散模型,显著提升长视频生成的稳定性和训练效率。该模型支持文本转视频、图像转视频及视频编辑等多种任务,通过双重架构优化时间序列与单帧细节,在自回归模型中表现优异。未来苹果将继续优化计算速度和物理准确性,推动视频生成技术发展。
字节发布Seedream 4.5 图像生成实现多图一致性
字节跳动Seed团队发布Seedream 4.5,重点突破多图场景一致性和美学指令遵循两大核心能力。新版本解决了AI图像生成中角色、服饰、光影在多图中不一致的痛点,实现了批量生成的高度统一,同时在复杂风格描述下精准控制画面质感,为电商、IP设计等商业场景提供强大支持。
消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力
2026-03-06
0 浏览
2026年大模型GEO优化服务商标杆企业推荐精选
2026-03-06
0 浏览
马云谈AI时代胜负关键:不在芯片在心跳 阿里核心高管齐聚云谷论教育
2026-03-06
0 浏览
2026年GEO优化服务商Top3推荐:商家AI搜索流量布局指南
2026-03-06
0 浏览
中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜
2026-03-06
0 浏览
全国人大代表吴丰礼:建议试点粤港澳大湾区AI制度创新,夯实具身智能工业数据基建
2026-03-06
0 浏览
头部酒企新春首课聚焦AI:不转型就出局
2026-03-06
0 浏览
千问持续投入AI办事 春节完成2亿笔真实订单
2026-03-06
0 浏览
追觅科技在浙江新设智能科技公司,注册资本2000万元
2026-03-06
0 浏览
霍尔木兹海峡受阻 丰田被迫减产4万辆汽车
2026-03-06
0 浏览