TAG:研究基准

AI科研新基准:FrontierScience测评模型推理能力

AI科研新基准:FrontierScience测评模型推理能力

本文介绍了新推出的AI科学研究基准FrontierScience,该基准专注于评估AI模型在物理、化学和生物等领域的专家级科学推理能力。文章通过初步评估结果展示了GPT-5.2在奥林匹克版和研究版中的表现,并探讨了AI如何加速科学研究流程以及当前在开放式思维方面的局限性。

2025-12-17 16:40
0
0