TAG:MoE
阿里黑科技炸场!0.6B 小模型“魔改”成 17B MoE,激活参数仅 5%,CPU 直接跑 30token/s!
本文介绍阿里国际数字商业团队推出的Marco-Mini-Instruct MoE模型,该模型通过Upcycling技术由0.6B小模型升级为17B总参数规模,激活参数仅5%,CPU上可实现30token/s的推理速度,性能超越4B级Dense模型,为行业提供了低成本、高效率的MoE炼制新路径,大幅降低中小团队落地MoE的门槛。
蚂蚁开源Ring-flash-linear-2.0-128K模型,混合注意力与MoE架构提升长文本编程效率
在AI大模型竞争白热化的当下,高效推理与长上下文处理已成为开发者痛点。近日,蚂蚁集团旗下百灵大模型团队正式开源Ring-flash-linear-2.0-128K,一款专为超长文本编程设计的创新模型。
AI算力的“B计划”:当AMD与IBM联手,用1024张MI300X,炼出了第一个“非NVIDIA”大模型
AMD携手IBM与Zyphra发布全球首个纯AMD硬件训练的大模型ZAYA1,采用MoE架构预训练14T tokens,性能与Qwen3系列持平。ZAYA1创新性采用CCA注意力机制和线性路由MoE,在数学推理等STEM领域表现优异,验证了AMD MI300X+ROCm在大规模模型训练中的可行性。
鲍威尔即将揭晓最终悬念,超级AI财报日今夜来临
2026-04-29
0 浏览
《Science》发布一项基于拓扑学的微型机器人研究:会“解扣起跳”的绳子刷新跳跃极限
2026-04-29
0 浏览
美股全线低开超3300股下跌,英伟达、特斯拉等齐跌,存储股走强希捷涨超17%,美联储将公布利率决议
2026-04-29
0 浏览
华科毕业生历时8年打造深圳独角兽企业,冲刺“全栈式智能机器人第一股”
2026-04-29
0 浏览
科创板数字芯片公司业绩会:细分赛道分化成长,国产AI算力及高端芯片加速突围
2026-04-29
0 浏览
机器人赛道一季度融资超百亿元:人形机器人与具身智能成主线,早期项目受资本追捧
2026-04-29
0 浏览
灵心巧手完成B+轮融资,开启自进化智能体新范式
2026-04-29
0 浏览
日本航空将于5月测试引入中国人形机器人,以应对老龄化压力
2026-04-29
0 浏览
奇瑞汽车一季度净利润41.7亿元:营收同比降3.45%,毛利增长超两成,海外销量占比超六成
2026-04-29
0 浏览
Happy Horse盲测“屠榜”与实测口碑分化,AI视频三强竞争白热化
2026-04-29
0 浏览