TAG:AI模型

DeepSeek代码库泄露神秘标识符MODEL1 新一代旗舰或2月发布

DeepSeek代码库泄露神秘标识符MODEL1 新一代旗舰或2月发布

DeepSeek代码库中出现大量指向未知模型“MODEL1”的标识符,技术细节显示其在KV缓存、稀疏性处理及FP8支持上与现有V3系列架构不同,暗示可能为全新模型序列。结合官方近期论文及V4发布计划,推测“MODEL1”或是新一代旗舰模型的工程化落地,预计在代码能力上有重大突破。

2026-01-21 11:02
0
0

英伟达推出 PersonaPlex-7B-v1 全双工语音交互技术

英伟达推出 PersonaPlex-7B-v1 全双工语音交互技术

英伟达发布PersonaPlex-7B-v1全双工语音对话模型,采用单一Transformer架构实现端到端语音理解与生成,显著降低延迟并支持自然中断处理。该模型通过语音和文本双重引导实现深度个性化控制,在对话流畅度和任务达成率上表现优异,重塑了实时语音交互体验。

2026-01-19 15:44
0
0

美团开源工具LongCat-Flash-Thinking-2601发布,调用能力再创新高

美团开源工具LongCat-Flash-Thinking-2601发布,调用能力再创新高

美团LongCat团队开源了最新的AI模型LongCat-Flash-Thinking-2601,该模型在工具调用、智能体搜索和推理能力上达到开源模型的最高水平。其核心优势包括卓越的工具调用能力,显著降低真实场景中的训练成本,并提供免费的在线“重思考模式”体验,模拟人类深思过程。模型在编程、数学推理等多项评测中表现领先,并通过创新的评测方法验证了强大的泛化能力。

2026-01-16 17:31
0
0

特斯拉马斯克回应英伟达:自动驾驶99%易,长尾挑战难

特斯拉马斯克回应英伟达:自动驾驶99%易,长尾挑战难

文章报道了特斯拉CEO埃隆·马斯克对英伟达在CES上推出的自动驾驶AI模型的隔空回应。马斯克指出,实现99%的自动驾驶相对容易,真正的挑战在于解决复杂且罕见的'长尾问题'。文章对比了两家公司在技术路径和落地时间上的不同观点,突显了自动驾驶领域竞争的核心焦点。

2026-01-06 17:42
9
0

物理AI迎来ChatGPT时刻 英伟达发布自动驾驶新模型 解决多种难题

物理AI迎来ChatGPT时刻 英伟达发布自动驾驶新模型 解决多种难题

英伟达在CES 2026上发布了名为Alpamayo的全新自动驾驶汽车模型系列,该模型采用基于思维链推理的视觉-语言-动作(VLA)技术,能够处理罕见和复杂的驾驶场景,使车辆具备类似人类的推理能力。英伟达宣布将免费开源此模型,以加速行业创新,并已获得多家车企和研究机构的支持。

2026-01-06 16:55
6
0

英伟达首发自动驾驶新模型,物理AI迎来ChatGPT时刻

英伟达首发自动驾驶新模型,物理AI迎来ChatGPT时刻

英伟达在CES 2026上发布了名为Alpamayo的全新自动驾驶汽车模型系列,该模型采用基于思维链推理的视觉-语言-动作(VLA)技术,能够处理罕见和复杂的驾驶场景,使车辆具备类似人类的推理能力。英伟达宣布将免费开源此模型,以加速行业创新,并已获得多家车企和研究机构的支持。

2026-01-06 15:21
0
0

英伟达黄仁勋称机器人领域迎来ChatGPT时刻

英伟达黄仁勋称机器人领域迎来ChatGPT时刻

英伟达CEO黄仁勋在CES 2026上宣布机器人领域迎来'ChatGPT时刻',并发布了一系列开源物理AI模型,包括世界模型Cosmos Transfer 2.5/Predict 2.5、视觉语言模型Cosmos Reason 2以及人形机器人模型Isaac GR00T N1.6。这些模型旨在通过模拟环境安全训练机器人,并赋予其类人的视觉推理与精准控制能力,同时推出了性能更强的Jetson T4000硬件以支持物理AI运行。

2026-01-06 11:28
0
0

物理AI迎来突破时刻 英伟达发布新成果 黄仁勋发声

物理AI迎来突破时刻 英伟达发布新成果 黄仁勋发声

英伟达在CES 2025上宣布开源其首个推理VLA模型Alpamayo 1,为自动驾驶技术带来突破。该模型通过类人思维处理复杂驾驶场景,提供可解释的决策过程,旨在加速安全自动驾驶的开发。CEO黄仁勋称此为'物理AI的ChatGPT时刻',并宣布首款搭载该技术的汽车将于第一季度上路。

2026-01-06 10:41
7
0

长跑型AI亮相:Jan团队推出Jan-v2-VL,提升多步任务执行能力

长跑型AI亮相:Jan团队推出Jan-v2-VL,提升多步任务执行能力

Jan团队发布Jan-v2-VL-Max多模态大模型,专注于解决AI在长周期执行任务中的稳定性问题。该30B参数模型采用LoRA-based RLVR技术,有效减少多步操作误差累积,抑制幻觉现象,在幻象递减回报基准测试中超越Gemini2.5Pro等模型,适用于Agent自动化、UI控制等复杂场景,支持网页体验和本地私有化部署。

2025-12-24 16:30
0
0

通义千问发布Qwen-Image-Layered模型 支持图片分层编辑

通义千问发布Qwen-Image-Layered模型 支持图片分层编辑

通义千问团队发布创新图像生成模型Qwen-Image-Layered,通过‘图层拆解’技术将静态图片分解为语义独立的RGBA图层,实现精准的‘指哪改哪’编辑。该模型解决了传统AI编辑中全局破坏一致性和局部边界模糊的痛点,支持重新着色、物体替换、文字修改等操作,并允许可变数量图层分解与无限层级细化,为用户提供直观、鲁棒的图片编辑能力。

爱力方 2025-12-22 17:28
22
0

英伟达发布Nemotron 3 混合架构优化AI代理效率

英伟达发布Nemotron 3 混合架构优化AI代理效率

英伟达发布Nemotron 3系列AI模型,采用创新的Mamba与Transformer混合架构,专为高效处理长上下文窗口的AI代理系统设计。该系列包括Nano、Super和Ultra型号,支持高达百万令牌的上下文,在保持内存稳定的同时提升处理效率。Nano型号已上市,并开源权重和数据集,助力开发者加速创新。

2025-12-18 17:43
0
0

快手AI编程模型KAT-Coder-Pro V1跻身全球榜单前十

快手AI编程模型KAT-Coder-Pro V1跻身全球榜单前十

快手研发的Agentic Coding模型KAT-Coder-Pro V1在Artificial Analysis Intelligence Index评测中取得突破性进展,以64分超越Claude4.5Sonnet,强势入围全球AI榜单Top10,并在Non-Reasoning Model榜单中斩获第一名。该模型不仅性能卓越,还实现了出色的价格与性能平衡,输出Token消耗量远低于同性能区间模型。

爱力方 2025-12-16 16:39
17
0

迪士尼向谷歌发出版权警告

迪士尼向谷歌发出版权警告

迪士尼近日向谷歌发出停止侵权通知,指控其AI模型侵犯了《冰雪奇缘》、《星球大战》等多部经典作品的版权。与此同时,迪士尼宣布与OpenAI达成十亿美元合作,将利用AI技术生成视频内容。谷歌回应称双方关系良好,并已实施多项版权保护措施。

2025-12-12 11:07
0
0

Meta新AI模型牛油果明年面世 蒸馏学习技术引关注

Meta新AI模型牛油果明年面世 蒸馏学习技术引关注

Meta宣布将于2024年第一季度推出新一代AI大模型“牛油果”,该模型采用蒸馏学习技术,借鉴了阿里巴巴Qwen等模型,旨在提升AI能力。文章分析了Meta从开源转向闭源策略的背景,以及公司在AI领域面临的竞争压力与战略调整。

2025-12-11 16:01
0
0

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

微软发布VibeVoice‑Realtime 实时文本转语音模型 助力互动应用

微软推出VibeVoice-Realtime-0.5B,这是一款轻量级实时文本转语音模型,支持流式文本输入和长篇语音输出。该模型能在约300毫秒内开始输出可听语音,特别适合代理对话、实时数据讲述等互动式应用。通过交错窗口设计和声学标记器优化,它在LibriSpeech测试中字错误率仅2.00%,表现卓越,为AI语音合成提供了高效解决方案。

2025-12-08 11:14
0
0