TAG:推理能力

DeepSeek 发布突破性研究:架构优化显著提升AI推理能力

DeepSeek 发布突破性研究:架构优化显著提升AI推理能力

DeepSeek最新研究揭示,通过优化神经网络架构而非单纯扩大模型规模,可显著提升大语言模型的推理能力。其提出的“流形约束超连接”方法解决了信号传播不稳定问题,在多项基准测试中实现性能突破,同时仅增加约6%-7%的训练开销,为AI发展提供了高效且经济的新路径。

2026-01-04 17:45
0
0

DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线

DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线

DeepSeek于12月4日无预警发布两款重磅新模型:DeepSeek-V3.2正式版与极致推理版DeepSeek-V3.2-Speciale。V3.2首次实现“思考过程”与“工具调用”深度融合,在智能体评测中登顶开源第一;Speciale版本则专注于极限推理能力,在复杂任务中表现卓越。两款模型已全平台无缝上线,用户可即时体验。

爱力方 2025-12-04 15:26
10
0