TAG:AI测试

AI办公准确率不足25%,进展却超预期

AI办公准确率不足25%,进展却超预期

一项由Mercor公司发布的研究报告显示,当前主流AI模型在处理真实办公室任务时准确率不足25%,最高仅为24%。该研究采用APEX-Agents基准测试,模拟律师、顾问等实际工作流,发现AI在跨源信息整合和上下文处理方面存在明显短板,短期内难以替代人类知识工作者。尽管表现有限,但AI准确率从一年前的5%-10%提升至24%,进展速度超出预期。

2026-01-26 15:24
0
0