TAG:Deepseek
中方回应Deepseek新AI模型采用英伟达芯片训练
中国外交部发言人毛宁在例行记者会上回应了关于Deepseek最新AI模型可能使用英伟达AI芯片训练的提问,表示不了解具体情况,并重申了中方对美国输华芯片问题的原则立场。
美称DeepSeek AI模型采用英伟达先进芯片 中方重申对美输华芯片立场
外交部发言人毛宁在例行记者会上回应美方关于DeepSeek AI模型使用英伟达先进芯片训练的指控,表示不了解具体情况,并重申中方在美国输华芯片问题上的原则立场。
Mistral CEO指DeepSeek借鉴架构 技术圈热议谁师从谁
Mistral CEO Arthur Mensch 声称中国开源模型 DeepSeek-V3 基于其架构,引发技术圈关于创新与借鉴的激烈讨论。文章深入分析了两者论文发布时间、架构设计差异以及技术反转现象,揭示了全球AI实验室在快速迭代中的竞争焦虑与开源精神的本质。
国产算力再攀高峰 摩尔线程携手硅基流动实现DeepSeek V3 671B高效推理单卡性能达国际顶尖水平
摩尔线程与硅基流动基于国产GPU MTT S5000,成功完成对千亿参数大模型DeepSeek V3 671B的高效适配与推理验证。通过创新应用FP8低精度推理技术,单卡性能表现亮眼,推理速度逼近国际顶尖水平,标志着国产AI算力生态从“能跑”迈向“高效跑”的关键突破,为关键领域提供了高性价比、高安全性的本土化AI部署选项。
DeepSeek代码库泄露神秘标识符MODEL1 新一代旗舰或2月发布
DeepSeek代码库中出现大量指向未知模型“MODEL1”的标识符,技术细节显示其在KV缓存、稀疏性处理及FP8支持上与现有V3系列架构不同,暗示可能为全新模型序列。结合官方近期论文及V4发布计划,推测“MODEL1”或是新一代旗舰模型的工程化落地,预计在代码能力上有重大突破。
摩根资产管理:中国科技领域将涌现更多DeepSeek突破
摩根资产管理表示,中国科技领域将迎来更多类似DeepSeek的技术突破,人工智能支出和有利政策将成为关键催化剂。年初至今中国科技股指数已上涨12%,表现优于美国同类指数,显示投资者对中国科技前景的乐观态度。
DeepSeek论文发布 下一代大模型实现记忆分离 V4版本即将到来
DeepSeek最新论文提出条件记忆模块,为大模型实现“记忆分离”,优化推理与知识检索的效率。该技术可能成为下一代稀疏大模型的核心架构,或应用于即将发布的DeepSeek V4模型,提升编程和数学等领域的性能表现。
微软报告:DeepSeek 高性价比突围,海外市场份额超半数
微软最新研究报告显示,国产AI初创企业DeepSeek凭借开源免费的高性价比策略,在全球发展中国家市场迅速崛起。在中国市场份额高达89%,在俄罗斯、白俄罗斯等国家份额超40%,通过预装华为等手机快速扩张,有效缩小数字鸿沟。
恶意扩展窃取AI对话 90万用户隐私遭殃
超过90万Chrome用户因安装伪装成生产力工具的恶意扩展,导致ChatGPT和DeepSeek对话内容被窃取。这些扩展通过监控用户活动,提取敏感提示、回复和元数据,并收集浏览习惯,对企业数据安全构成严重威胁。文章提供了企业防护建议,包括移除恶意扩展、实施白名单策略和数据丢失防护措施。
英伟达CEO称开源数据是未来AI信任基石
英伟达CEO黄仁勋在CES 2026上盛赞DeepSeek-R1开源模型的领先地位,并指出开源模型已反超闭源模型约六个月。他强调开源数据是构建AI信任的基石,并宣布英伟达将开源训练数据。同时,英伟达发布了涵盖语言、机器人、自动驾驶及医疗四大领域的全新模型与数据集,定义了多模态融合、跨环境部署和普及化加速的未来AI范式。
DeepSeek 发布突破性研究:架构优化显著提升AI推理能力
DeepSeek最新研究揭示,通过优化神经网络架构而非单纯扩大模型规模,可显著提升大语言模型的推理能力。其提出的“流形约束超连接”方法解决了信号传播不稳定问题,在多项基准测试中实现性能突破,同时仅增加约6%-7%的训练开销,为AI发展提供了高效且经济的新路径。
DeepSeek与元宝深度互动 AI助手加速融入日常生活
本文探讨了DeepSeek与元宝AI助手的互动如何推动AI技术融入日常生活。通过分析用户使用数据,揭示了AI助手从工具演变为全天候思考伙伴的趋势,并介绍了元宝团队的技术优化和“DeepSeek+”策略如何提升用户体验。
知乎发布2025 AI榜单:豆包登顶,DeepSeek领跑
知乎发布2025年度AI产品榜单,全面盘点AI行业最新进展。字节跳动豆包荣登“知友年度爱用”榜首,DeepSeek、通义千问紧随其后,海外产品Gemini、ChatGPT等表现稳定。榜单还显示垂直场景AI工具和搜索增强型AI需求强劲,反映了当前AI应用的发展趋势。
DeepSeek连发两款新模型 V3.2正式版与Speciale同步上线
DeepSeek于12月4日无预警发布两款重磅新模型:DeepSeek-V3.2正式版与极致推理版DeepSeek-V3.2-Speciale。V3.2首次实现“思考过程”与“工具调用”深度融合,在智能体评测中登顶开源第一;Speciale版本则专注于极限推理能力,在复杂任务中表现卓越。两款模型已全平台无缝上线,用户可即时体验。