TAG:评测基准
AI外呼迈入精准时代 声网美团发布首个行业评测基准
声网与美团联合发布首个AI外呼行业评测基准VoiceAgentEval,通过真实业务场景、多维度评估和150种对话模拟,推动AI模型从技术参数转向业务实效,让AI外呼更具人性化和实用性。
全球首个物理AI全模态测试基准发布 重塑AI与现实连接
飞捷科思智能科技与复旦大学联合发布全球首个面向真实物理世界的统一全模态评测基准FysicsWorld,旨在解决AI在物理世界感知与理解上的短板。该基准包含16大类高难度任务,要求AI整合视觉、听觉、语言等多模态信息进行深度推理,并引入防作弊机制确保测试有效性。这一成果为AI从虚拟对话迈向真实行动提供了关键评估工具,加速具身智能与机器人技术的发展。
谷歌最强轻量模型Gemini 3.1曝光 实时渲染UI惊艳亮相
2026-03-25
0 浏览
多个社交平台禁关官方账号 汽车之家辟谣网传车辆测试内容
2026-03-25
0 浏览
芯驰科技以场景引领深度协同打造高性能车规芯片软硬件一体化平台新范式
2026-03-25
0 浏览
山西省首部AI微短剧《蚀影密符》登陆IMAX巨幕厅
2026-03-25
0 浏览
前沿科技赋能AI旗舰 三星Galaxy S26系列媒体体验沙龙在沈阳举办
2026-03-25
0 浏览
卓视智通完成B2轮融资,推动物理AI加速赋能千行百业
2026-03-25
0 浏览
你的模型真能举一反三吗 RoboChallenge Table30 V2 正式发布开启泛化时代
2026-03-25
0 浏览
法官质疑美政府报复Anthropic AI监管是否沦为政治清算
2026-03-25
0 浏览
AI圈现教科书级投毒:Karpathy发帖警告,千万级神库litellm遭殃
2026-03-25
0 浏览
Karpathy 警告:AI 开发神器 litellm 遭供应链投毒 数万凭证或已泄露
2026-03-25
0 浏览