TAG:RAG系统

谷歌发布FACTS基准测试 顶尖AI模型准确率均不足七成

谷歌发布FACTS基准测试 顶尖AI模型准确率均不足七成

谷歌与Kaggle联合发布FACTS基准测试,旨在评估生成式AI模型在企业任务中的事实性与真实性。测试结果显示,包括Gemini3Pro、GPT-5和Claude4.5Opus在内的所有顶尖模型综合准确率均低于70%,尤其在多模态任务中表现不佳。该基准测试涵盖参数、搜索、多模态和上下文四个子测试,为企业AI采购提供了新的评估标准,并强调了RAG系统在提升准确性中的必要性。

爱力方 2025-12-11 11:36
0
0