TAG:神经网络架构

DeepSeek 发布突破性研究:架构优化显著提升AI推理能力

DeepSeek 发布突破性研究:架构优化显著提升AI推理能力

DeepSeek最新研究揭示,通过优化神经网络架构而非单纯扩大模型规模,可显著提升大语言模型的推理能力。其提出的“流形约束超连接”方法解决了信号传播不稳定问题,在多项基准测试中实现性能突破,同时仅增加约6%-7%的训练开销,为AI发展提供了高效且经济的新路径。

2026-01-04 17:45
0
0