TAG:多模态AI
灵光App全面登陆12大应用市场 加速鸿蒙生态布局
蚂蚁集团推出的全模态AI助手灵光App鸿蒙版已正式登陆AppGallery,集对话、AIGC内容创作和闪应用等功能于一体,为3200万鸿蒙用户提供前沿的多模态AI体验。该应用支持将抽象知识可视化并快速生成个性化小工具,目前已覆盖iOS、华为、小米等12大应用市场,自上线以来用户已创建1200万个闪应用,未来还将持续升级功能。
鸿蒙版灵光App上架 多模态AI赋能鸿蒙生态
蚂蚁集团推出的鸿蒙版灵光App已登陆AppGallery应用市场,作为业内首个全代码生成多模态内容的AI助手,集对话、AIGC创作和闪应用于一体。它通过可视化功能将抽象知识转化为图像,支持图片深度识别与追问,并能快速生成可交互的生活小应用,满足商务、学生、设计师等不同群体的需求,为鸿蒙用户带来前沿的智能体验。
谷歌扩展AI视频工具Flow功能:支持竖屏及8秒4K视频生成
谷歌宣布扩大AI视频工具Flow的访问权限,向商务、企业及教育版Workspace用户开放。该工具搭载Veo3.1模型,支持根据文本或图像生成8秒4K视频,并新增竖屏支持,内置专业编辑功能如光效调整和物体编辑。它还集成音频生成和图像生成器,实现从静态创意到动态影像的无缝衔接。
多模态AI推动A股热潮 多只概念股集体涨停
文章分析了多模态AI概念在A股市场的强势表现,多只相关个股涨停。核心驱动在于以通义千问Qwen3-VL、GPT-5.2为代表的多模态大模型取得技术突破,实现跨模态理解,并快速渗透至智能硬件、内容生成、企业服务等多个应用场景。文章指出,在政策与技术的双重驱动下,多模态AI正从概念验证迈向规模化商用,市场投资逻辑从“单模态”转向“全感知”,押注其重构人机交互范式的长期价值。
Liquid AI 发布 LFM2.5:一款面向边缘设备的小型 AI 模型家族
Liquid AI 发布了 LFM2.5 小型基础模型家族,专为边缘设备和本地部署设计。该系列包括文本、视觉语言和音频语言变种,在 GPQA、MMLU Pro 等基准测试中表现优异,超越了同类开源模型。模型采用高效架构,支持多模态任务和区域优化,适用于文档理解、实时语音对话等多种边缘计算场景。
人工智能公司Clipto.AI完成Pre-A++轮融资 估值达2.5亿美元
人工智能公司 Clipto.AI 宣布成功完成 Pre-A++ 轮融资,公司估值突破 2.5 亿美元。本轮融资由 EnvisionX Capital 和 Palm Drive Capital 领投,红杉中国、高瓴创投等知名投资机构跟投。融资资金将主要用于加强端侧多模态 AI 模型和系统架构的研发,推动 AI 助理产品的迭代升级,以加速技术创新并满足市场需求。
源 Yuan3.0Flash 开源多模态大模型引领 AI 新潮流
Yuan3.0Flash是一款开源的40B参数多模态基础大模型,采用创新的稀疏混合专家架构,显著降低算力消耗并提升推理准确性。模型支持二次开发,在企业应用中已超越GPT-5.1,在多模态检索和表格理解等任务上表现优异,有效降低AI应用成本。
2026年消费AI新机遇:从模板到多模态,赢得用户青睐
本文分析了2026年消费级AI市场的新机遇,基于a16z的观点,指出成功关键在于贴近用户需求。文章提出三大策略:通过爆款样式降低创作门槛、利用多模态AI整合创作路径,以及深耕专业用户群体,为创业者提供了实用的发展方向。
亚马逊部署Mistral AI的Voxtral模型
本文介绍了Mistral AI推出的Voxtral多模态模型,包括Voxtral-Mini-3B-2507和Voxtral-Small-24B-2507两个版本,支持音频和文本处理。详细展示了如何利用vLLM和亚马逊SageMaker的BYOC功能在AI端点上部署该模型,实现高效的音频转录、多语言处理及企业级应用。
智象未来完成A+轮融资
多模态AI企业智象未来近日完成A+轮融资,由京东集团和金华市金婺赋能基金联合参投。融资资金将主要用于核心业务拓展与技术研发,以推动公司在多模态AI领域的进一步发展。据悉,公司已启动B轮融资筹备,计划于2026年初完成交割,展现了其持续增长的潜力。
智谱开源周落幕 四项视频生成技术开放
智谱多模态开源周圆满落幕,团队开源了四项视频生成核心技术:SCAIL、RealVideo、Kaleido和SSVAE。这些技术分别针对影视级角色动画生成、实时流式视频生成、多主体一致性生成以及训练效率优化,旨在解决视频生成领域的关键难题,推动AI视频技术的发展与创新。
谷歌FACTS基准揭示AI模型准确率上限70%
谷歌与Kaggle联合发布FACTS基准套件,填补AI模型事实准确性评估的标准化空白。该基准涵盖法律、金融和医疗等关键领域,测试显示包括Gemini3Pro、GPT-5在内的主流模型整体准确率均未突破70%,尤其在多模态任务中表现不足,为企业AI应用提供重要参考。
谷歌发布FACTS基准测试 顶尖AI模型准确率均不足七成
谷歌与Kaggle联合发布FACTS基准测试,旨在评估生成式AI模型在企业任务中的事实性与真实性。测试结果显示,包括Gemini3Pro、GPT-5和Claude4.5Opus在内的所有顶尖模型综合准确率均低于70%,尤其在多模态任务中表现不佳。该基准测试涵盖参数、搜索、多模态和上下文四个子测试,为企业AI采购提供了新的评估标准,并强调了RAG系统在提升准确性中的必要性。
蚂蚁集团发布灵光网页版AI助手,30秒快速生成小应用
蚂蚁集团正式推出灵光网页版AI助手,用户可通过浏览器直接访问,体验其强大的自然语言生成小应用功能。该助手支持30秒快速创建小应用,并实现电脑与手机端数据同步,大幅提升工作和学习效率。灵光助手还支持处理3D模型、音频、图标等多种模态信息,成为业内首个全代码生成多模态内容的AI助手。
阿里开源Qwen3-VL,攻克长视频分析难题,引领多模态技术突破
阿里巴巴开源了新一代视觉-语言大模型Qwen3-VL,在长视频分析领域取得重大突破。该模型在长达2小时的视频中能保持99.5%的关键帧定位准确率,解决了长时序理解的核心难题。同时,在视觉数学和多语言文档处理等专项任务上也达到业界领先水平,为视频分析、智能剪辑等应用提供了自主可控的解决方案。