TAG:谷歌FACTS

谷歌FACTS基准揭示AI模型准确率上限70%

谷歌FACTS基准揭示AI模型准确率上限70%

谷歌与Kaggle联合发布FACTS基准套件,填补AI模型事实准确性评估的标准化空白。该基准涵盖法律、金融和医疗等关键领域,测试显示包括Gemini3Pro、GPT-5在内的主流模型整体准确率均未突破70%,尤其在多模态任务中表现不足,为企业AI应用提供重要参考。

2025-12-11 14:29
0
0