TAG:模型优化

DeepSeek 发布突破性研究：架构优化显著提升AI推理能力

DeepSeek最新研究揭示，通过优化神经网络架构而非单纯扩大模型规模，可显著提升大语言模型的推理能力。其提出的“流形约束超连接”方法解决了信号传播不稳定问题，在多项基准测试中实现性能突破，同时仅增加约6%-7%的训练开销，为AI发展提供了高效且经济的新路径。

aibase

2026-01-04 17:45

DeepSeek双模型重磅开源长文本与深度思考能力再突破

DeepSeek发布V3.2双模型，标准版在128k上下文场景下与GPT-5互有胜负，深度思考版在多项基准测试中与Gemini3Pro打平。核心升级转正稀疏注意力（DSA）将长文本计算复杂度降至线性，显存占用下降40%，推理速度提升2.2倍，首次实现开源模型百万token单卡推理。模型已开源并允许商业化，下一步将开源DSA内核与RL训练框架，推动开源阵营在长文本与推理能力上冲击领先地位。

aibase

2025-12-03 10:40

清华新发现：AI大模型不止看“块头”，更要重视密度

清华大学在《自然・机器智能》发表研究，提出AI大模型评估新概念“能力密度”，强调不应仅关注参数规模，而需重视每个参数的智能水平。研究发现能力密度正以每3.5个月翻倍的速度增长，未来小体积模型将实现更高性能。这项突破推动AI向精炼高效发展，已成功应用于手机、汽车等智能设备领域。

爱力方

2025-11-24 11:36

通知

尊敬的用户

user

TAG:模型优化

DeepSeek 发布突破性研究：架构优化显著提升AI推理能力

DeepSeek双模型重磅开源长文本与深度思考能力再突破

清华新发现：AI大模型不止看“块头”，更要重视密度

快讯

消费者购车洽谈遭录音奥迪门店称厂家要求折射经销商返利考核压力

2026年大模型GEO优化服务商标杆企业推荐精选

马云谈AI时代胜负关键：不在芯片在心跳阿里核心高管齐聚云谷论教育

2026年GEO优化服务商Top3推荐：商家AI搜索流量布局指南

中国AI产品创新提速美图RoboNeo登顶巴西App Store分类榜

全国人大代表吴丰礼：建议试点粤港澳大湾区AI制度创新，夯实具身智能工业数据基建

头部酒企新春首课聚焦AI：不转型就出局

千问持续投入AI办事春节完成2亿笔真实订单

追觅科技在浙江新设智能科技公司，注册资本2000万元

霍尔木兹海峡受阻丰田被迫减产4万辆汽车

推荐专栏

爱力方

机器人大讲堂

user

TAG:模型优化

DeepSeek 发布突破性研究：架构优化显著提升AI推理能力

DeepSeek双模型重磅开源 长文本与深度思考能力再突破

清华新发现：AI大模型不止看“块头”，更要重视密度

快讯

消费者购车洽谈遭录音 奥迪门店称厂家要求 折射经销商返利考核压力

2026年大模型GEO优化服务商标杆企业推荐精选

马云谈AI时代胜负关键：不在芯片在心跳 阿里核心高管齐聚云谷论教育

2026年GEO优化服务商Top3推荐：商家AI搜索流量布局指南

中国AI产品创新提速 美图RoboNeo登顶巴西App Store分类榜

全国人大代表吴丰礼：建议试点粤港澳大湾区AI制度创新，夯实具身智能工业数据基建

头部酒企新春首课聚焦AI：不转型就出局

千问持续投入AI办事 春节完成2亿笔真实订单

追觅科技在浙江新设智能科技公司，注册资本2000万元

霍尔木兹海峡受阻 丰田被迫减产4万辆汽车

推荐专栏

爱力方

机器人大讲堂

DeepSeek双模型重磅开源长文本与深度思考能力再突破

消费者购车洽谈遭录音奥迪门店称厂家要求折射经销商返利考核压力

马云谈AI时代胜负关键：不在芯片在心跳阿里核心高管齐聚云谷论教育

中国AI产品创新提速美图RoboNeo登顶巴西App Store分类榜

千问持续投入AI办事春节完成2亿笔真实订单

霍尔木兹海峡受阻丰田被迫减产4万辆汽车