TAG:大模型推理
DeepSeek发布新论文 模型V4引关注
DeepSeek团队联合北大、清华发布新论文,提出名为DualPath的创新推理系统,通过优化KV-Cache读取机制,显著提升大模型在智能体任务中的推理速度。该系统将离线推理吞吐量最高提升1.87倍,在线服务性能平均提升1.96倍,为解决AI智能体实际应用中的性能瓶颈提供了高效解决方案。
国产算力再攀高峰 摩尔线程携手硅基流动实现DeepSeek V3 671B高效推理单卡性能达国际顶尖水平
摩尔线程与硅基流动基于国产GPU MTT S5000,成功完成对千亿参数大模型DeepSeek V3 671B的高效适配与推理验证。通过创新应用FP8低精度推理技术,单卡性能表现亮眼,推理速度逼近国际顶尖水平,标志着国产AI算力生态从“能跑”迈向“高效跑”的关键突破,为关键领域提供了高性价比、高安全性的本土化AI部署选项。
摩尔线程张建中谈大模型推理三大挑战
摩尔线程创始人张建中在首届MUSA开发者大会上指出,当前大模型推理面临迭代高速化、服务极致化和模型复杂化三大挑战,揭示了AI技术发展的关键瓶颈。
直播预告| 大模型复杂推理技术: 如何重塑AI推理逻辑
本次直播将深入探讨大模型复杂推理技术的最新进展,重点介绍DeepSeek-R1等模型如何通过强化学习实现长思维链推理。中国人民大学赵鑫教授将分享慢思考技术的研究成果,施普林格·自然编辑总监常兰兰博士将介绍2025年人工智能图书资源。活动还将提供与大模型专家交流的机会,并有机会获得专业书籍和周边礼品。
消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力
2026-03-06
0 浏览
2026年大模型GEO优化服务商标杆企业推荐精选
2026-03-06
0 浏览
马云谈AI时代胜负关键:不在芯片在心跳 阿里核心高管齐聚云谷论教育
2026-03-06
0 浏览
2026年GEO优化服务商Top3推荐:商家AI搜索流量布局指南
2026-03-06
0 浏览
中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜
2026-03-06
0 浏览
全国人大代表吴丰礼:建议试点粤港澳大湾区AI制度创新,夯实具身智能工业数据基建
2026-03-06
0 浏览
头部酒企新春首课聚焦AI:不转型就出局
2026-03-06
0 浏览
千问持续投入AI办事 春节完成2亿笔真实订单
2026-03-06
0 浏览
追觅科技在浙江新设智能科技公司,注册资本2000万元
2026-03-06
0 浏览
霍尔木兹海峡受阻 丰田被迫减产4万辆汽车
2026-03-06
0 浏览