TAG:腾讯混元
腾讯混元1.5开源 手机端侧AI实现实时多语互译
腾讯发布并开源混元翻译模型1.5版,支持33种语言互译,专为移动端侧部署优化。其轻量级1.8B版本仅需1GB内存即可实现手机离线实时翻译,性能媲美主流闭源模型。模型具备自定义术语库和优秀上下文理解能力,已在腾讯会议等产品中应用,为多语种实时翻译带来突破。
腾讯混元发布ETC首款AI智能体 畅行体验再升级
腾讯云与安徽驿路微行科技联合推出基于混元大模型的ETC助手AI智能体,支持文本和语音交互,提供高准确率问答与设备控制服务,已服务超百万用户,显著提升出行效率和体验。
腾讯推出混元世界模型1.5 实现实时交互虚拟世界
腾讯发布了混元世界模型1.5,这是国内首个开放的实时互动体验平台。用户通过简单的文字或图片描述,即可快速生成独特的互动虚拟世界,并支持以24帧/秒的速度实时探索。模型具备长范围3D一致性和多样化交互体验,适用于游戏、影视及虚拟现实等领域。腾讯还首次开源了完整的训练体系,为AI生成内容开辟了新的可能性。
AI的“数字雕塑家”:拓竹科技用一张照片,为你打印一个“迷你版”的自己
拓竹科技推出基于腾讯混元3D3.0大模型的3D手办生成器「印你」,用户仅需上传一张图片即可快速生成高质量、可打印的3D模型。该工具简化了传统建模流程,通过三步操作实现人物面容、衣着与姿态的精确再现,大幅降低3D创作门槛,适合爱好者与新手体验个性化定制。
OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”
腾讯混元开源全新OCR模型HunyuanOCR,仅10亿参数却斩获多项SOTA成绩。该模型采用端到端设计,在复杂文档解析、多场景文字检测识别中表现卓越,支持14种小语种翻译并荣获ICDAR2025冠军。轻量化架构便于部署,已应用于卡证处理、视频创作等场景,用户可通过GitHub和Hugging Face快速体验。
腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛
腾讯混元大模型团队发布全新视频生成模型HunyuanVideo1.5,这款基于DiT架构的轻量级模型参数量达8.3B,支持文生视频和图文结合生成动态视频。模型采用SSTA稀疏注意力机制,仅需14G显存即可流畅运行,大幅降低视频创作门槛。支持中英文输入及多种风格,在运动连贯性和语义遵循方面达到商用水平,已在元宝平台、Hugging Face和GitHub开放体验。