TAG:大语言模型
DeepSeek V4即将发布 多模态模型或重塑AI格局
DeepSeek即将发布全新多模态模型V4,具备图像、视频和文本生成能力,并全面支持国产算力。同时推出的V4 Lite测试版拥有2000亿参数和100万tokens上下文窗口,原生多模态架构显著提升处理能力。这一系列技术突破将加速AI与本土芯片的融合,为人工智能领域带来新的发展动力。
中国AI模型全球使用量首超美国,MiniMax等国产力量领跑榜单
根据OpenRouter最新数据,中国AI模型在2025年2月全球Token使用量首次超越美国,实现历史性反超。以MiniMax、月之暗面、智谱和DeepSeek为代表的中国开源模型表现强劲,其中MiniMax M2.5发布仅两周便登顶榜首。这一增长凸显了中国AI研发的迅猛发展和企业级应用的巨大潜力。
DeepSeek V4细节曝光:支持百万上下文与原生多模态
DeepSeek V4作为国产AI领军模型,技术细节曝光:具备万亿参数规模、原生多模态处理能力以及高达100万token的上下文窗口,可一次性处理超长文本或代码库。模型优先适配国产算力平台,发布在即,预计将冲击全球AI竞争格局。
元宝骂人引热议 大模型技术失态难题待解
腾讯元宝AI在春节期间因多次向用户输出辱骂内容登上热搜,暴露了大模型在多轮对话中输出异常的技术困境。文章探讨了AI产品责任归属模糊、行业普遍存在的技术失态现象,以及营销热潮后用户留存面临的挑战。
谷歌Gemini遭大规模蒸馏攻击,单次攻击触发超10万次提示
谷歌近日披露其AI聊天机器人Gemini遭遇大规模蒸馏攻击,攻击者通过重复提问超过10万次试图窃取模型内部机制。此类攻击主要由商业动机行为者发起,旨在克隆模型或强化自身AI系统,凸显了AI知识产权保护面临的严峻挑战。专家警告,随着定制化AI工具的普及,蒸馏攻击可能蔓延至更广泛领域,威胁企业敏感数据安全。
字节跳动推出豆包大模型2.0对标GPT 5.2与Gemini 3 Pro
字节跳动于2月14日正式发布豆包大模型2.0,该模型围绕大规模生产环境需求进行优化,具备高效推理、多模态理解和复杂指令执行能力。其Pro版本对标GPT 5.2与Gemini 3 Pro,专为深度推理与长链路任务设计,同时提供Lite、Mini及Code版以满足不同场景需求。模型已上线豆包App及火山引擎API服务。
警惕开源AI脱离监管风险:研究指出可能成为黑客攻击温床
SentinelOne与Censys的研究显示,脱离主流平台监管的开源大语言模型在私有环境中运行时,面临严重安全风险。研究发现数千个未受保护的AI实例,黑客可劫持模型生成垃圾信息、钓鱼邮件,甚至修改核心指令以支持有害活动,传统防护手段难以应对。
Cell Reports Medicine发表!龙尔平万沛星团队推出医疗大模型框架MCC显著提升推理能力
中国医学科学院与北京大学团队在《Cell Reports Medicine》发表研究,提出MCC框架,通过多模型对抗与协作机制提升医疗AI推理能力。该框架模拟多学科专家会诊,实现交叉质证与协同决策,在MedQA等基准测试中准确率超过92.6%,刷新多项纪录,推动医疗AI向可靠、可解释方向演进。
华港财富前瞻2026全球生成式AI趋势 大模型竞赛进入中场战事
华港财富发布的《2026全球生成式AI趋势前瞻》报告指出,全球生成式AI竞争已进入“中场战事”,大模型竞争焦点转向算力生态与商业变现。报告深入分析了OpenAI与Google在模型能力、算力供给和商业模式上的核心较量,并解读了中国市场由字节、阿里、腾讯等科技巨头主导的差异化发展路径,揭示了2026年AI重塑互联网商业模式的趋势。
重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0
智元机器人在CES发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0,通过融合三维重建与视觉生成技术,实现数字孪生级高保真环境。平台支持自然语言指令快速生成万级场景,并开源上万小时仿真数据集与多维度评估体系,显著加速具身智能模型的训练验证与工业应用落地。
开源浏览器操控工具发布 1美元可执行200任务
BrowserUse发布开源大模型BU-30B-A3B-Preview,采用MoE架构实现高效浏览器自动化。该模型具备卓越的DOM理解和视觉推理能力,支持多模态输入,每1美元可完成约200个任务,大幅降低AI网页操作成本。开发者可免费获取并集成,加速Web Agent生态发展。
IROS2025:大语言模型结合行为树,机器人自适应操作新突破
本文介绍了一种结合大语言模型与行为树的人机交互学习机制,用于实现自适应机器人操作。该方法通过上下文学习和人机交互引导,生成可直接应用于机器人的动作知识,有效减少了LLM调用次数并提升了任务成功率。实验表明,该方法在多种任务中表现出良好的适应性和泛化能力,能够应对外部干扰并处理新任务。
GPT-5.2发布 OpenAI称其专业能力最强
OpenAI发布GPT-5.2系列模型,号称在专业知识工作方面表现最佳,包括电子表格、演示文稿、编码和长上下文理解等任务。该系列提供Instant、Thinking和Pro三个版本,其中Thinking模型在GDPval测试中70.9%的结果优于或持平行业专家,并在多项推理基准中超越竞争对手。模型已向付费用户开放,旨在提升工作流程可靠性和生产效率。
太空数据中心首现轨道,Starcloud训练大语言模型
初创公司Starcloud成功在太空轨道上训练大语言模型,成为全球首个太空数据中心。利用英伟达H100芯片和谷歌Gemma等模型,该公司计划构建太阳能驱动的轨道数据中心,成本远低于地面设施,并已应用于海洋监测和森林火灾预警等商业服务。
阿里通义发布SAPO强化学习法,提升大语言模型性能
阿里通义Qwen团队推出新型强化学习方法SAPO,通过平滑温度控制门控函数替代传统硬剪切,有效解决大语言模型在强化学习中的策略优化不稳定问题。该方法具备连续信任域、序列级一致性和token级自适应性等优势,在数学推理、代码生成等任务上表现显著优于GRPO和GSPO,为AI研究提供了新方向。