TAG:开源技术
人形机器人开源实力几何 年轻团队展示惊人成果
萝博派对开源了双足人形机器人“萝博头原型机”的全栈技术方案,包括硬件专利、核心算法和工程细节,实现了3m/s的跑步速度,打破开源项目性能滞后的偏见。该项目提供从设计到验证的完整工程路径,支持二次开发,旨在降低研发门槛,推动人形机器人行业的开放协作与规模化发展。
印度版DeepSeek问世 Alpie大模型凭套壳技术逆袭榜单
印度AI公司169PI发布的Alpie大模型在GSM8K和SWE等国际榜单中表现抢眼,部分指标超越GPT-4o和Claude3.5,被称为印度版“DeepSeek”。该模型基于中国开源模型DeepSeek-R1进行二次开发,通过4bit量化技术大幅降低运行门槛,推理成本仅为GPT-4o的十分之一,为中小开发者提供了高性价比选择。
物理AI迎来突破时刻 英伟达发布新成果 黄仁勋发声
英伟达在CES 2025上宣布开源其首个推理VLA模型Alpamayo 1,为自动驾驶技术带来突破。该模型通过类人思维处理复杂驾驶场景,提供可解释的决策过程,旨在加速安全自动驾驶的开发。CEO黄仁勋称此为'物理AI的ChatGPT时刻',并宣布首款搭载该技术的汽车将于第一季度上路。
北京幻方发布40B参数大模型 开源引发AI领域关注
九坤投资开源IQuest-Coder-V1系列大模型,40B参数版本在SWE-Bench Verified榜单取得81.4%高分,超越Claude Opus-4.5等知名模型。该系列提供7B、14B、40B三个版本,支持代码生成与理解任务,并创新采用代码流多阶段训练策略,提升逻辑动态捕捉能力。模型可在单张3090/4090显卡运行,大幅降低使用门槛,展现了中国AI领域的重要进展。
小红书复旦联手开源AI图像排版工具InstanceAssemble
小红书与复旦大学联合开源InstanceAssemble技术,通过创新的实例拼装注意力机制,实现了AI图像生成中对物体位置的精准排版控制。该技术适配主流模型仅需极低额外参数,解决了布局控制生成中的对齐不准和语义脱节问题,并开源了代码、模型及基准测试集,为设计、广告等行业提供强大工具。
北京推出国内首个符合国标的VLA大模型机器人XR-1
北京人形机器人创新中心开源了国内首个符合具身智能国家标准的VLA大模型XR-1,标志着中国在智能机器人领域的重要突破。该模型具备跨平台运行能力,能精准执行复杂操作,并配套提供RoboMIND2.0数据底座和ArtVIP数据集,为开发者与研究人员提供了强大的技术支持与资源。
全球最强开源医疗大模型“安诊儿”在浙江发布,支持国产芯片并聚焦精准诊疗与心理健康
文章介绍了全球参数量最大的开源医疗大模型'安诊儿'在浙江发布,拥有1000亿参数,全面支持国产芯片,聚焦精准诊疗与心理健康。该模型具备深度推理和临床落地能力,已应用于心脏健康与青少年心理两大场景,并启动开源社区推动医疗AI生态发展。
英伟达推出通用AI智能体NitroGen 实现4万小时游戏视频进化
英伟达发布通用AI智能体NitroGen,该模型通过分析YouTube和Twitch上超过4万小时的游戏视频,学习人类玩家的操作逻辑,成为能适应多种游戏类型的“全能玩家”。它基于OpenVision动作模型,集成GR00T N1.5机器人技术,在陌生游戏环境中表现优异,成功率比传统模型提升52%。研究团队已开源相关论文、代码和数据集,推动具身智能和通用代理领域发展。
北京人形机器人开源VLA大模型XR-1 助力高效作业
北京人形机器人创新中心开源了其核心的具身智能跨本体视觉语言动作(VLA)大模型XR-1,旨在系统性解决机器人如何‘能干活、会干活’的核心难题。XR-1模型在权威测评中表现出色,具备跨场景、跨本体的多任务执行能力,并配合大规模数据集RoboMIND V2.0,为机器人实用化提供了完整的技术方案,推动具身智能向‘全自主、更好用’的目标迈进。
小米百度齐投 00后创始人公司引领人形机器人开源热潮
文章报道了00后创始人黄一创立的上海萝博派对科技公司,在短时间内连续获得小米、百度等一线资本投资,专注于全栈开源双足人形机器人研发。文章详细介绍了公司从大学宿舍起步的开源理念、技术路径、产品进化以及构建开发者生态的长期战略,展现了年轻团队在硬科技领域的创新与潜力。
小米AI布局加速 罗福莉亮相基座大模型跻身全球开源TOP2
小米在合作伙伴大会上首次公开亮相AI大模型负责人罗福莉,并发布开源大模型MiMo-V2-Flash,该模型在全球开源榜单中排名TOP2,具备低成本、高速度优势。小米宣布未来五年研发投入2000亿元,重点布局芯片、OS和AI三大核心技术,推动AI与物理世界深度结合。
商汤进军具身智能领域 联合创始人执掌大晓机器人
商汤科技正式进军具身智能领域,推出全新品牌“大晓机器人”,由联合创始人王晓刚担任董事长。公司将于12月18日发布ACE技术范式、具身超级大脑模组A1,并开源国内首个商业应用的“开悟”世界模型3.0,旨在解决机器人智能大脑泛化性不足的行业难题,推动具身智能在安防、巡检等工业场景的快速落地。
大晓机器人亮相,首席科学家领衔打造国内首款开源商用世界模型
大晓机器人将于12月18日正式亮相,发布包括全球首创ACE技术范式及国内首个开源且商业落地的‘开悟’世界模型3.0在内的多项领先技术。公司由商汤科技联合创始人王晓刚出任董事长,AI科学家陶大程担任首席科学家,旨在构建自主可控的具身智能产业体系,并推出具身超级大脑模组A1,推动在安防、巡检等场景的规模化商业应用。
告别视频扭曲与“AI电音”:巨人网络多模态模型让虚拟世界更真实
巨人网络AI Lab联合清华大学和西北工业大学发布三项多模态生成技术:YingVideo-MV实现音乐驱动视频生成并消除人物畸变,YingMusic-SVC提供零样本歌声转换确保真实歌曲可用,YingMusic-Singer支持任意歌词生成自然歌声。这些开源技术显著提升了音视频创作的质量与灵活性。
语音交互的“GPT时刻”:当MOSS学会“直接听、直接说”,传统方案全面过时
复旦大学MOSS团队开源国内首个端到端语音到语音大模型MOSS-Speech,采用创新层拆分架构,无需传统ASR→LLM→TTS流程即可实现语音问答、情绪模仿和笑声生成。在ZeroSpeech2025评测中WER低至4.1%,情感识别准确率91.2%,中文口语MOS分达4.6接近真人水平。提供48kHz超采样和16kHz轻量版本,支持单张RTX4090实时推理,延迟低于300ms,已开放商用许可。