TAG:多模态交互
阿里云发布多模态交互开发套件,集成通义千问等AI模型,助力智能硬件开发
阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,为AI眼镜、机器人等智能硬件提供开箱即用的AI能力。套件支持语音、图像、文本多模态交互,内置学习、生活、创意等场景的Agent工具,大幅降低硬件智能化门槛,助力厂商快速抢占AI终端市场。
阿里云推出多模态交互开发套件 适配AI眼镜与机器人
阿里云在通义智能硬件展上发布多模态交互开发套件,集成了千问、万相、百聆三款通义基础大模型,并预置生活休闲、工作效率等领域的Agent和MCP工具,可广泛应用于AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备,为开发者提供便捷的智能交互解决方案。
前谷歌美团元老加持 AI硬件新锐Looki获超2000万美元A轮融资
AI硬件创业公司Looki宣布完成超2000万美元A轮融资,由蚂蚁集团领投。公司由前Google与美团元老创立,首款多模态AI硬件Looki L1全球销量近万台,市场反响热烈。融资将用于人才建设、模型迭代及供应链整合,加速探索以人为中心的AI交互新可能。
元宝混元2025报告:超七成用户偏爱快思考模式
元宝平台发布2025年度混元大模型使用报告,显示超7成用户偏好快思考模式,近半数问题首轮即可解决。深度思考模式适用于复杂场景,近50%能输出结构化内容。报告还介绍了混元在图像、视频及多模态交互方面的升级,包括图生图、文字生成图片和视频、低延迟语音通话等功能,展现了AI能力的多维度提升。
青岛发布国内首个全模态实时交互大模型 VisualGPT,打造“所见即所得”AI体验
青岛发布国内首个全模态实时交互大模型VisualGPT,实现视觉界面即时互动新突破。该模型支持图片/视频上传后直接圈选标注,秒级返回结构化答案或可执行代码,端到端延迟低于300ms。已在教育、医疗、金融等领域开放SDK应用,配套智能体训练平台提供千张A100/H100算力资源,助力打造千亿级全模态交互产业链。
百度发布全新多模态 AI 助手 “超能小度”,数千万设备可免费升级!
百度在2023世界大会上正式发布全新多模态AI助手'超能小度',该助手融合语音、视觉和空间环境信息,具备更强的感知能力。不仅能实现停车位记录、物业电话拨打等实用功能,还支持会议纪要整理、AI随心看护等智能服务。数千万台小度设备可免费升级,让用户体验从'执行命令'到'主动思考'的智能生活转变。
AI陪伴机器人,人形机器人的全新可能?
本文探讨AI陪伴机器人市场的快速发展,重点分析人形机器人在儿童教育、老年陪伴和成人情感支持等多元化场景的应用前景。文章详细介绍了优必选、盛视科技等企业在人形机器人领域的技术突破和商业布局,并展望了AI陪伴机器人未来30.8%复合年增长率的市场潜力。