TAG:技术进展
AI办公准确率不足25%,进展却超预期
一项由Mercor公司发布的研究报告显示,当前主流AI模型在处理真实办公室任务时准确率不足25%,最高仅为24%。该研究采用APEX-Agents基准测试,模拟律师、顾问等实际工作流,发现AI在跨源信息整合和上下文处理方面存在明显短板,短期内难以替代人类知识工作者。尽管表现有限,但AI准确率从一年前的5%-10%提升至24%,进展速度超出预期。
国产龙头大模型捷报“三箭齐发” 技术与资本共振 AI应用加速落地
文章报道了国产大模型领域的最新进展,包括MiniMax港股上市市值破千亿、阿里千问下载量爆发式增长以及DeepSeek即将发布新模型。这些进展标志着国产AI已从参数比拼进入资本市场认可、生态建设和垂直应用深化的新阶段,AI应用在消费层加速渗透,同时通过降本增效推动传统业务变革,带来新的投资机会。
OpenAI新图像模型疑曝光 开启盲测引关注
OpenAI疑似正在测试代号为“Chestnut”和“Hazelnut”的下一代图像生成模型,已在Design Arena与LM Arena平台开启盲测。新模型在图像真实感、世界知识理解、代码与公式渲染等方面表现突出,可能对标未来的Image-2系列,最快有望于近期与GPT-5.2同步发布。
理想汽车遇困 机器人业务成救命稻草
2026-03-18
0 浏览
蓝芯算力获数亿融资 创始人为字节前芯片负责人
2026-03-18
0 浏览
360发布反AI投毒监测工具 促GEO行业规范发展
2026-03-18
0 浏览
日本乐天AI 3.0开源风波:删除DeepSeek许可证后紧急补救
2026-03-18
0 浏览
科技股回暖带动市场情绪 存储芯片持续走强 周期股逆市下挫
2026-03-18
0 浏览
英伟达连发7款重磅芯片 从芯片商转型AI工厂 黄仁勋战略转向
2026-03-18
0 浏览
国内SaaS行业面临AI挑战 如何应对市场变革
2026-03-18
0 浏览
鹏华陈大烨前瞻布局AI全链条 从算力基建到应用投资
2026-03-18
0 浏览
王兴兴放话G1机器人全球领先 20年后仍经典 揭秘春晚机器人幕后
2026-03-18
0 浏览
多路资金博弈存储芯片股 游资联手量化抢筹金开新能
2026-03-18
0 浏览