TAG:AI推理
谷歌Gemini 3推出Deep Think模式,AI推理能力大幅增强
谷歌正式推出Gemini 3 Deep Think模式,专为Google AI Ultra订阅用户设计,显著提升AI在复杂数学、科学和逻辑问题上的推理能力。该模式在多项严格基准测试中表现卓越,如未使用工具时在“人类最后的考试”中取得41.0%成绩,使用代码执行时在ARC-AGI-2测试中达到45.1%。用户可通过简单选择立即体验这一先进功能,推动AI技术进步。
黑芝麻智能拟投4亿收购亿智电子 拓展机器人AI芯片应用
黑芝麻智能宣布拟以4-5.5亿元收购亿智电子多数股权,旨在整合双方技术优势,实现车规级AI芯片产品线全系覆盖,并拓展至机器人等新兴应用场景。此次收购预计2026年第一季度完成,将增强公司在自动驾驶及边缘AI领域的整体竞争力。
Meta推出CoT-Verifier:通过归因图定位AI推理错误
Meta AI实验室推出CoT-Verifier模型,通过分析链式思维推理的归因图结构,精准定位AI推理错误。该技术不仅能识别错误步骤,还能通过定向干预提升模型性能,在MATH数据集上使Llama3.1准确率提升4.2个百分点。模型已开源,支持一键复现,为开发者提供推理过程的'结构异常分'和错误定位功能。
AMD收购MK1强化AI推理市场布局
AMD于2025年11月成功收购AI推理初创公司MK1,旨在加速布局AI推理市场。MK1的核心技术Flywheel与AMD Instinct GPU深度优化,可日处理超万亿token,显著提升推理效率与成本效益。此次收购强化了AMD在金融、医疗等领域的AI解决方案能力,推动其构建从训练到推理的端到端非NVIDIA生态。
引擎的叛逆:Llama.cpp史诗级更新,本地AI迎来“Ollama时刻”
llama.cpp迎来史诗级更新,实现多模态输入、并行交互和JSON结构化输出三大突破。用户可直接处理图片、音频和PDF文件,通过现代化Web界面进行多任务并行处理,并自定义JSON模板实现自动化输出。所有操作100%本地运行,保障数据隐私,为普通用户和开发者提供高效安全的本地AI解决方案。
华为发布AI推理新技术 将于今年9月正式开源
华为发布AI推理创新技术UCM(推理记忆数据管理器),这是一款以KV Cache为中心的推理加速套件,能有效提升推理效率并降低成本。该技术计划于2025年9月正式开源,已在多个行业场景中试点应用。文章还探讨了AI推理在行业落地中的挑战及未来发展趋势。