TAG:架构迁移
昇腾助力TransMLA:无需重训即可适配主流大模型
北京大学团队提出TransMLA转化框架,无需重训即可将主流大模型(如LLaMA、Qwen)迁移至高效的MLA架构,显著降低企业适配成本。该框架通过结构映射、RoRoPE位置编码适配等关键技术,在昇腾算力支持下实现KV缓存大幅压缩与推理速度提升,为大模型长上下文推理提供软硬件协同解决方案。
万兴剧厂发布全链路平台 联手生数科技攻克AI视频随机性难题
2026-02-28
0 浏览
春节假期充电难问题获改善
2026-02-28
0 浏览
上海新增11款生成式AI服务过审 累计达149款
2026-02-28
0 浏览
长城汽车人均年终奖超5万元?魏建军:具体不知道,肯定多一些
2026-02-28
0 浏览
春节红包大战正酣,美团祭出原生“深度研究”智能体,“AI+本地生活”战局升级
2026-02-28
0 浏览
马年首个交易日,港股机器人板块爆发!AI应用概念走强,智谱、MiniMax市值双双冲破3000亿港元
2026-02-28
0 浏览
退伍后成为项目经理,“00后”用AI赋能老破小社区物业管理|新春走基层
2026-02-28
0 浏览
本体寒冬?来一次人形机器人大摸底!
2026-02-28
0 浏览
再携手!清华陈建宇×斯坦福Chelsea团队发布VLAW,世界模型×VLA协同进化
2026-02-28
63 浏览
存储芯片持续上涨 DRAM或短期见顶 NAND供需失衡持续
2026-02-28
0 浏览