TAG:长上下文推理

昇腾助力TransMLA：无需重训即可适配主流大模型

北京大学团队提出TransMLA转化框架，无需重训即可将主流大模型（如LLaMA、Qwen）迁移至高效的MLA架构，显著降低企业适配成本。该框架通过结构映射、RoRoPE位置编码适配等关键技术，在昇腾算力支持下实现KV缓存大幅压缩与推理速度提升，为大模型长上下文推理提供软硬件协同解决方案。

资讯中国

2026-01-13 15:28

快讯

Chrome 为 Gemini 上线“技能库”功能：支持一键复用提示词，减少重复输入

2026-04-15

0 浏览

国产万亿参数大模型 Kimi K2.6-code 上线，编程能力对标 Sonnet 4.6

2026-04-15

0 浏览

AI眼镜进入爆发期：千问旗舰款眼镜S1开售，苹果或将于明年上市

2026-04-15

0 浏览

英伟达推出面向量子计算的AI模型，全球量子科技产业加速发展

2026-04-15

0 浏览

英伟达发布量子AI模型Ising，美股存储、光通信及燃料电池相关个股齐创阶段新高

2026-04-15

0 浏览

市场延续震荡反弹，AI算力产业链领涨，锂电产业链持续活跃

2026-04-15

0 浏览

机器人半程马拉松将开赛：阿里、荣耀将携首款具身机器人参赛征战

2026-04-15

0 浏览

AI Agent赋能安全充换电业态，尖电科技实现“智慧能源生态”布局跨越

2026-04-15

0 浏览

汇添富基金沈若雨：AI人工智能产业正从预期走向现实

2026-04-15

0 浏览

HH-200航空商用无人运输系统首飞取得成功

2026-04-15

0 浏览

通知

尊敬的用户

user

TAG:长上下文推理

昇腾助力TransMLA：无需重训即可适配主流大模型

快讯

Chrome 为 Gemini 上线“技能库”功能：支持一键复用提示词，减少重复输入

国产万亿参数大模型 Kimi K2.6-code 上线，编程能力对标 Sonnet 4.6

AI眼镜进入爆发期：千问旗舰款眼镜S1开售，苹果或将于明年上市

英伟达推出面向量子计算的AI模型，全球量子科技产业加速发展

英伟达发布量子AI模型Ising，美股存储、光通信及燃料电池相关个股齐创阶段新高

市场延续震荡反弹，AI算力产业链领涨，锂电产业链持续活跃

机器人半程马拉松将开赛：阿里、荣耀将携首款具身机器人参赛征战

AI Agent赋能安全充换电业态，尖电科技实现“智慧能源生态”布局跨越

汇添富基金沈若雨：AI人工智能产业正从预期走向现实

HH-200航空商用无人运输系统首飞取得成功

推荐专栏

爱力方

机器人大讲堂