TAG:长任务处理

Anthropic旗舰模型Claude Opus4.5刷新长任务处理纪录

Anthropic旗舰模型Claude Opus4.5刷新长任务处理纪录

Anthropic旗舰模型Claude Opus4.5在METR基准测试中创下长任务处理新纪录,能在保持50%成功率的前提下持续处理约4小时49分钟的复杂任务,展现了AI从短指令回复向长程项目执行的转型潜力。

爱力方 2025-12-22 15:42
0
0