TAG:人工智能基础设施
AI推理领域估值飙升:Modal Labs推进新一轮融资,或估值25亿美元
AI推理基础设施公司Modal Labs正洽谈新一轮融资,估值或达25亿美元,较去年9月翻倍以上。公司专注于优化AI模型推理过程,帮助企业降低计算成本和延迟,年化收入约5000万美元。随着AI应用落地加速,推理赛道成为资本竞争焦点。
全国首个3万卡AI集群上线,万亿参数大模型迎来新突破
中科曙光宣布全国首个3万卡AI算力集群正式上线,这是目前国内规模最大的国产AI算力池,支持万亿参数大模型训练和高通量AI推理。该集群采用开放架构,兼容CUDA生态并支持多品牌国产加速卡混插,已适配优化400多个主流大模型,显著提升科研与产业应用效率。
云工场科技中标5亿元算力项目 助力国产AI算力集群规模化发展
云工场科技成功中标总金额超5亿元的人工智能产业基地项目,将建设以国产GPU为核心的万卡级算力集群,并配套统一的算力管理与调度平台。该项目旨在支持AI模型训练与推理,为数十至上百家AI企业提供算力服务,标志着国产算力从示范走向规模化运营的新阶段。
vLLM团队创立Inferact,估值达8亿美元瞄准全球AI推理市场
vLLM原班人马创立AI基础设施公司Inferact,以8亿美元估值完成1.5亿美元种子轮融资,旨在通过优化推理引擎技术,大幅降低AI推理成本并提升效率,推动人工智能向实用化阶段迈进。
中国AI存储技术在美国崭露头角
文章揭示了AI存储这一被忽视的关键赛道,指出其在提升GPU利用率、优化大模型训练效率中的核心作用。重点介绍了Shared-Everything这一中国原创的分布式存储架构如何在美国市场获得成功,并催生了VAST Data这样的高估值独角兽企业,展现了技术创新在AI基础设施领域的重要价值。
CES 2026:黄仁勋杨元庆携手 揭秘AI超级工厂蓝图
在CES 2026上,联想CEO杨元庆与英伟达创始人黄仁勋共同宣布合作推出“联想人工智能云超级工厂”。该计划将集成英伟达下一代Vera Rubin加速计算平台,旨在为全球云服务提供商提供高效AI部署方案,显著缩短大模型响应时间。超级工厂支持扩展至十万枚GPU规模,为万亿参数模型提供强大算力,并结合联想端到端集成能力,推动企业级AI在生产环境中稳定落地。
交通基建与AI技术推动沙特地产市场进入新增长周期
仲量联行指出,沙特利雅得房地产市场在‘2030愿景’推动下迎来深刻变革。220亿美元地铁项目、2.7吉瓦数据中心建设计划以及千亿美元规模的建筑市场成为主要驱动力。人工智能基础设施扩张和以公共交通为导向的开发(TOD)等新兴产业,正将利雅得塑造为充满活力的全球投资目的地。
字节跳动计划投入230亿美元发展AI基础设施
据报道,字节跳动计划在2026年投入约230亿美元用于AI基础设施建设,以追赶美国科技巨头。其中近一半预算将用于采购先进AI处理器,并可能试购英伟达H200芯片。尽管面临供应挑战,其频繁的算力招标与合作显示出全面进入AI建设爆发期的决心。
俄罗斯Nebius携2.5GW算力搅动全球AI战局
文章讲述了荷兰AI基建公司Nebius如何从俄罗斯互联网巨头Yandex脱胎重生,凭借深厚工程基因和全栈垂直整合能力,在2025年AI算力竞赛中异军突起。通过获得微软、Meta等巨头订单,计划建设2.5GW算力集群,Nebius以独特的商业模式和风险控制策略,改写全球AI基础设施格局,凸显技术自主与资源整合的核心竞争力。
OpenAI年内第四笔收购 4亿美元全股票拿下Neptune强化训练监控
OpenAI宣布以不足4亿美元全股票形式收购波兰初创公司Neptune,这是其2025年内的第四次收购。Neptune专注于AI训练监控与可视化,其技术将整合进GPT训练基础设施,提升模型训练的可追踪性和调试效率,有望缩短下一代模型的开发周期并降低成本。此次收购进一步强化了OpenAI向全栈AI基础设施的转型战略。
AMD携手HPE深化合作 共促开放AI基础设施规模化
AMD与HPE宣布扩大合作,共同推动开放式、可扩展的大规模AI基础设施发展。基于AMD的“Helios”全栈平台,该合作将集成EPYC处理器、Instinct GPU及ROCm软件栈,提供每机架高达2.9exaFLOPS的计算性能,旨在简化AI集群部署,提升灵活性和效率。HPE还将为德国HLRS推出搭载AMD技术的新超级计算机“Herder”,预计2027年投入使用,助力科学和工业创新。