TAG:大语言模型

DeepSeek企鹅家族深夜泄露 512预算剑指GPT-5.2 无推理挑战极速响应

DeepSeek企鹅家族深夜泄露 512预算剑指GPT-5.2 无推理挑战极速响应

文章披露了OpenAI内部代号“企鹅”的全新模型矩阵,包括旗舰Emperor512、中端Rockhopper64、轻量Macaroni16与零推理Mumble0四档推理预算。重点介绍了Emperor512可能作为GPT-5.2底层架构,以及Mumble0实现极速响应的技术特点,同时提及了即将上线的记忆搜索功能。该泄露信息揭示了OpenAI在模型效率、成本控制和全场景覆盖方面的战略布局,可能引发行业竞争与监管关注。

爱力方 2025-12-05 11:21
0
0

DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线

DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线

DeepSeek于12月4日无预警发布两款重磅新模型:DeepSeek-V3.2正式版与极致推理版DeepSeek-V3.2-Speciale。V3.2首次实现“思考过程”与“工具调用”深度融合,在智能体评测中登顶开源第一;Speciale版本则专注于极限推理能力,在复杂任务中表现卓越。两款模型已全平台无缝上线,用户可即时体验。

爱力方 2025-12-04 15:26
0
0

Mistral AI推出Mistral 3开源模型:128K上下文、单A100运行,价格仅为GPT-4o一半

Mistral AI推出Mistral 3开源模型:128K上下文、单A100运行,价格仅为GPT-4o一半

Mistral AI发布Mistral 3系列开源模型,包括3B、8B、14B及最强的Mistral Large3,支持128K上下文长度,在单张A100上即可运行。新模型在性能基准测试中与Llama3.1相当,定价仅为GPT-4o的一半,旨在为开发者和企业提供高性价比的AI解决方案。

2025-12-03 10:39
0
0

AI巅峰对决遭遇“滑铁卢”:Gemini 3 Pro与GPT-5在物理学测试中集体“翻车”

AI巅峰对决遭遇“滑铁卢”:Gemini 3 Pro与GPT-5在物理学测试中集体“翻车”

最新物理基准测试CritPt结果显示,即使是Gemini3Pro和GPT-5等顶级AI模型,在博士级物理研究挑战中的准确率不足10%。这项由50多位物理学家设计的测试涵盖11个前沿领域,旨在评估AI解决原创性科研问题的能力。结果表明当前AI在严谨性、创造性和推理稳定性方面存在明显不足,距离成为真正的自主科学家仍有巨大差距。

爱力方 2025-11-24 15:15
0
0

研究与探索 | 从机器人到具身智能:人工智能的“具身化”演进

研究与探索 | 从机器人到具身智能:人工智能的“具身化”演进

系统梳理了人工智能从传统机器人到具身智能的演进历程,详细解析了机器人技术从机械执行到感知交互的三个发展阶段,并重点探讨了大语言模型如何为具身智能提供'大脑'支撑。文章深入阐释了具身智能的核心特征——具身性与交互性,并展望了多模态感知、自主学习等前沿发展趋势,揭示了人工智能从虚拟计算走向实体交互的重要转型。

2025-11-12 16:47
0
0

OpenAI 疑似测试 GPT5.1,新模型代码和创意表现强劲,或为 NSFW 模式铺路

OpenAI 疑似测试 GPT5.1,新模型代码和创意表现强劲,或为 NSFW 模式铺路

OpenAI疑似正在测试GPT5.1模型,代号Polaris Alpha的新模型在OpenRouter平台上线,具备256K上下文容量和128K输出能力,知识库更新至2024年10月。测试显示该模型在文本生成、创意文案和编程任务中表现优异,支持长文本自我纠错,并能快速生成游戏代码和网页设计。结合Sam Altman此前关于NSFW模式的表态,外界猜测这可能是为GPT5.1的正式发布铺路。

2025-11-11 12:31
0
0

AI的“情感面具”:研究揭示机器生成的社交媒体帖子,正被人类轻易识破

AI的“情感面具”:研究揭示机器生成的社交媒体帖子,正被人类轻易识破

最新研究表明,AI生成的社交媒体内容在各大平台上容易被人类识别,准确率高达70%-80%。研究测试了九个主流大语言模型在Bluesky、Reddit和X平台的表现,发现AI在情感表达方面存在明显不足,特别是自发性和情感互动的缺失成为关键识别特征。未经过度训练的模型表现更佳,揭示了过度校准可能导致内容机械化的问题。

爱力方 2025-11-10 17:58
0
0

LeCun怒揭机器人最大骗局,坦白Llama与我无瓜

LeCun怒揭机器人最大骗局,坦白Llama与我无瓜

Meta首席AI科学家LeCun在MIT讲座中直言人形机器人是AI圈最大骗局,指出当前机器人仅具备窄智能,无法实现通用智能。他批评大语言模型(LLM)只是记忆力好但缺乏真实智能,强调世界模型才是实现通用人工智能的关键。文章还记录了特斯拉、Figure等公司对LeCun观点的激烈反驳,并回顾了LeCun在AI领域的开创性贡献。

2025-10-27 17:33
0
0

iFlow CLI

iFlow CLI

2025-10-17 16:19
12
0

字节提出Robix大模型!三阶训练+统一架构,打破机器人认知瓶颈,真实场景任务完成率领先

字节提出Robix大模型!三阶训练+统一架构,打破机器人认知瓶颈,真实场景任务完成率领先

字节跳动Seed团队推出Robix大模型,通过三阶训练和统一架构打破机器人认知瓶颈。该模型将视觉、语言和行动规划整合于单一架构,支持动态环境中的理解-决策-响应闭环,实现真实场景下的多轮对话和任务中断处理。实验显示在3D空间理解、任务规划和真实场景执行方面领先GPT-4o等模型,任务完成率显著提升。

2025-09-21 12:15
0
0