TAG:事实性评估
谷歌发布FACTS基准测试 顶尖AI模型准确率均不足七成
谷歌与Kaggle联合发布FACTS基准测试,旨在评估生成式AI模型在企业任务中的事实性与真实性。测试结果显示,包括Gemini3Pro、GPT-5和Claude4.5Opus在内的所有顶尖模型综合准确率均低于70%,尤其在多模态任务中表现不佳。该基准测试涵盖参数、搜索、多模态和上下文四个子测试,为企业AI采购提供了新的评估标准,并强调了RAG系统在提升准确性中的必要性。
帕友赠妙手仁心致谢珠江医院团队AI评估与8触点疗法
2025-12-15
0 浏览
商汤发布多剧集生成智能体Seko2.0 国产AI芯片打通多模态AIGC全链路
2025-12-15
0 浏览
扫地机器人鼻祖iRobot申请破产重组 本月曾遭热炒
2025-12-15
0 浏览
具身智能加速落地 机遇挑战并存
2025-12-15
0 浏览
全球AI竞争力榜:美国居首中国次席
2025-12-15
0 浏览
长安汽车总裁赵非上任,旗下两子公司近百亿增资方案出炉
2025-12-15
0 浏览
金融权重护盘提振有限 AI硬件股深调 商业航天概念持续走强
2025-12-15
0 浏览
意法半导体芯片交付量或两年翻番,2027年将达百亿枚
2025-12-15
0 浏览
特斯拉启动无安全员Robotaxi路测
2025-12-15
0 浏览
深之蓝完成IPO辅导 拟冲刺科创板
2025-12-15
0 浏览