TAG:模型优化
DeepSeek 发布突破性研究:架构优化显著提升AI推理能力
DeepSeek最新研究揭示,通过优化神经网络架构而非单纯扩大模型规模,可显著提升大语言模型的推理能力。其提出的“流形约束超连接”方法解决了信号传播不稳定问题,在多项基准测试中实现性能突破,同时仅增加约6%-7%的训练开销,为AI发展提供了高效且经济的新路径。
DeepSeek双模型重磅开源 长文本与深度思考能力再突破
DeepSeek发布V3.2双模型,标准版在128k上下文场景下与GPT-5互有胜负,深度思考版在多项基准测试中与Gemini3Pro打平。核心升级转正稀疏注意力(DSA)将长文本计算复杂度降至线性,显存占用下降40%,推理速度提升2.2倍,首次实现开源模型百万token单卡推理。模型已开源并允许商业化,下一步将开源DSA内核与RL训练框架,推动开源阵营在长文本与推理能力上冲击领先地位。
清华新发现:AI大模型不止看“块头”,更要重视密度
清华大学在《自然・机器智能》发表研究,提出AI大模型评估新概念“能力密度”,强调不应仅关注参数规模,而需重视每个参数的智能水平。研究发现能力密度正以每3.5个月翻倍的速度增长,未来小体积模型将实现更高性能。这项突破推动AI向精炼高效发展,已成功应用于手机、汽车等智能设备领域。
我国2025年人形机器人产品发布超330款
2026-01-21
0 浏览
工信部将发布人形机器人与具身智能标准化建设指南
2026-01-21
0 浏览
马斯克重启特斯拉Dojo3芯片项目,瞄准太空AI发展
2026-01-21
0 浏览
人形机器人为何难以突破灵巧手技术难关
2026-01-21
0 浏览
中国AI厂商加速拓展国际市场,全球份额持续攀升
2026-01-21
0 浏览
Block推出开源AI编程助手Goose,应对Claude Code痛点
2026-01-21
0 浏览
工信部:新能源汽车与光伏等行业竞争环境持续优化
2026-01-21
0 浏览
清华两名室友联手打造吸金超2亿元的机器人
2026-01-21
0 浏览
江苏企业获批牵头建设农业农村部智能采收机器人重点实验室
2026-01-21
0 浏览
政策产业共振推升机器人股 微创机器人盘中大涨16%
2026-01-21
0 浏览