TAG:开源
枢途开源HORA数据集:10万轨迹全视频采集,赋能通用具身训练
枢途科技发布业界首个从真实场景人类视频中提取的多模态具身智能数据集HORA,包含15万条高质量轨迹,覆盖多种实际应用场景。该数据集基于SynaData技术构建,支持毫米级轨迹提取和跨本体适配,有效解决传统数据采集成本高、通用性差的问题,为机器人技能训练提供完整、可直接使用的数据基础。
国产算力与自主创新架构助力GLM-Image实现多模态SOTA性能,全链路适配昇腾芯片
智谱AI与华为联合开源GLM-Image多模态大模型,该模型采用自主创新架构,在图像生成性能上达到国际领先水平,并首次实现从数据处理到推理全流程基于国产昇腾芯片和MindSpore框架,标志着国产AI生态在自主可控与高性能应用上迈出关键一步。
DeepSeek发布梁文锋新论文 百川智能开源医疗大模型Baichuan-M3
本文报道了AI领域的最新动态:DeepSeek发布由创始人梁文锋署名的新论文并开源记忆模块Engram,提出大语言模型稀疏性的新思路;百川智能开源医疗大模型Baichuan-M3,其在权威评测中表现优异并具备端到端严肃问诊能力。同时,Meta为聚焦AI研发,计划裁减虚拟现实部门员工。文章梳理了行业技术进展与战略调整。
重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0
智元机器人在CES发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0,通过融合三维重建与视觉生成技术,实现数字孪生级高保真环境。平台支持自然语言指令快速生成万级场景,并开源上万小时仿真数据集与多维度评估体系,显著加速具身智能模型的训练验证与工业应用落地。
MiniMax发布M2.1编程模型 开启AI开发新纪元
MiniMax正式开源M2.1编程模型,现已上线Hugging Face、ModelScope及GitHub等平台,并获得vLLM的“Day-0”支持,实现高效推理。通过KTransformers技术,可在RTX5090等设备上进行FP8本地推理,提升运行效率。同时推出“Coding Plan”优惠活动,包括9.9元月度套餐和好友邀请折扣,降低开发者使用门槛,助力AI应用创新。
国内首个国标VLA大模型开源 北京人形机器人XR-1实现智能干活
北京人形机器人创新中心开源国内首个通过国标测试的具身VLA大模型XR-1,配套RoboMIND2.0数据底座和ArtVIP数据集。该模型具备跨本体运行能力,能精准执行复杂操作,推动人形机器人从实验室走向真实场景应用,降低行业开发门槛。
罗福莉加入小米首秀:中国AI模型与顶尖差距缩短至数月,出身农村家庭曾获雷军千万元年薪
小米在合作伙伴大会上宣布开源Xiaomi MiMo-V2-Flash大模型,其负责人罗福莉首次公开亮相。这位95后AI专家分享了模型的技术突破,认为中国开源模型与全球顶尖闭源模型的差距已从三年缩短至数月。她出身农村普通家庭,曾被雷军以千万年薪挖角,如今带领团队致力于推动AGI普惠化。
蚂蚁开源Ring-flash-linear-2.0-128K模型,混合注意力与MoE架构提升长文本编程效率
在AI大模型竞争白热化的当下,高效推理与长上下文处理已成为开发者痛点。近日,蚂蚁集团旗下百灵大模型团队正式开源Ring-flash-linear-2.0-128K,一款专为超长文本编程设计的创新模型。
商汤开源NEO架构:数据量锐减九成,多模态模型性能仍领先
商汤科技联合南洋理工大学S-Lab发布原生多模态架构NEO,通过全新设计实现像素到Token的连续映射,数据需求仅为业界平均的1/10,在多个基准测试中取得SOTA性能,并开源模型权重与训练脚本。
告别复杂AI管道:OceanBase开源“智能心脏”,让数据自己说话
OceanBase发布首款AI原生数据库seekdb,支持向量、全文、标量和空间地理数据的统一混合搜索,深度融合AI推理与数据处理。开发者仅需三行代码即可快速构建AI应用,轻松应对百亿级多模数据检索,兼容30余种主流AI框架,实现开箱即用的AI数据基座。
灵渠OS机器人操作系统将于年底开源
智元机器人CMO邱恒在第二十七届高交会上宣布,公司自主研发的机器人操作系统"灵渠OS"计划于今年年底正式开源。该系统已封装大量核心能力,支撑智元面向多元场景打造的三大产品系列,基于"一体三智"技术体系实现运动智能、交互智能与作业智能的深度融合。
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
昆仑万维开源了交互式世界模型 Matrix-Game 2.0,实现了通用场景下的实时长序列交互生成能力,成为业内首个开源的世界模型。与 DeepMind 未开源的 Genie 3 相比,Matrix-Game 2.0 更注重产业化落地,可直接应用于游戏引擎、具身智能等场景。文章详细介绍了该模型的技术架构和实时交互能力,展示了其在虚拟世界生成方面的突破性进展。