TAG:腾讯混元

腾讯混元迎顶级科学家庞天宇,领衔多模态强化学习

腾讯混元迎顶级科学家庞天宇,领衔多模态强化学习

清华大学博士、前新加坡Sea AI Lab高级研究科学家庞天宇正式加盟腾讯,出任混元多模态部首席研究科学家,将重点负责强化学习技术的研究与突破,助力混元大模型在多模态领域的深度演进。此次加盟是腾讯AI人才战略的重要布局,展现了其在核心技术研发上的坚定投入。

2026-02-03 13:56
0
0

清华新星庞天宇加盟腾讯混元,领军多模态RL研究

清华新星庞天宇加盟腾讯混元,领军多模态RL研究

清华大学计算机系直博生、资深研究员庞天宇正式加入腾讯混元,出任首席研究科学家及多模态强化学习技术负责人。他将领军攻坚多模态生成与理解模型的前沿难题,重点聚焦强化学习与扩散模型、视觉语言模型等核心方向的深度融合。

2026-01-30 14:32
0
0

腾讯混元图像3.0开源,800亿参数引领AI创作新纪元

腾讯混元图像3.0开源,800亿参数引领AI创作新纪元

腾讯混元团队正式开源全球最强开源图生图模型——混元图像3.0,拥有800亿参数,采用混合专家架构,在LMArena榜单中位列第一梯队。模型通过‘先思考,后编辑’的核心技术,深度融合文本与视觉理解,支持增删改、风格变换、老照片修复等多种编辑功能,适用于从普通用户到专业设计师的广泛场景。

2026-01-28 16:50
88
0

腾讯混元1.5开源 手机端侧AI实现实时多语互译

腾讯混元1.5开源 手机端侧AI实现实时多语互译

腾讯发布并开源混元翻译模型1.5版,支持33种语言互译,专为移动端侧部署优化。其轻量级1.8B版本仅需1GB内存即可实现手机离线实时翻译,性能媲美主流闭源模型。模型具备自定义术语库和优秀上下文理解能力,已在腾讯会议等产品中应用,为多语种实时翻译带来突破。

爱力方 2025-12-30 17:14
23
0

腾讯混元发布ETC首款AI智能体 畅行体验再升级

腾讯混元发布ETC首款AI智能体 畅行体验再升级

腾讯云与安徽驿路微行科技联合推出基于混元大模型的ETC助手AI智能体,支持文本和语音交互,提供高准确率问答与设备控制服务,已服务超百万用户,显著提升出行效率和体验。

2025-12-25 16:46
5
0

腾讯推出混元世界模型1.5 实现实时交互虚拟世界

腾讯推出混元世界模型1.5 实现实时交互虚拟世界

腾讯发布了混元世界模型1.5,这是国内首个开放的实时互动体验平台。用户通过简单的文字或图片描述,即可快速生成独特的互动虚拟世界,并支持以24帧/秒的速度实时探索。模型具备长范围3D一致性和多样化交互体验,适用于游戏、影视及虚拟现实等领域。腾讯还首次开源了完整的训练体系,为AI生成内容开辟了新的可能性。

2025-12-17 18:21
7
0

AI的“数字雕塑家”:拓竹科技用一张照片,为你打印一个“迷你版”的自己

AI的“数字雕塑家”:拓竹科技用一张照片,为你打印一个“迷你版”的自己

拓竹科技推出基于腾讯混元3D3.0大模型的3D手办生成器「印你」,用户仅需上传一张图片即可快速生成高质量、可打印的3D模型。该工具简化了传统建模流程,通过三步操作实现人物面容、衣着与姿态的精确再现,大幅降低3D创作门槛,适合爱好者与新手体验个性化定制。

爱力方 2025-12-12 12:09
33
0

 OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”

OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”

腾讯混元开源全新OCR模型HunyuanOCR,仅10亿参数却斩获多项SOTA成绩。该模型采用端到端设计,在复杂文档解析、多场景文字检测识别中表现卓越,支持14种小语种翻译并荣获ICDAR2025冠军。轻量化架构便于部署,已应用于卡证处理、视频创作等场景,用户可通过GitHub和Hugging Face快速体验。

爱力方 2025-11-25 17:51
6
0

腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛

腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛

腾讯混元大模型团队发布全新视频生成模型HunyuanVideo1.5,这款基于DiT架构的轻量级模型参数量达8.3B,支持文生视频和图文结合生成动态视频。模型采用SSTA稀疏注意力机制,仅需14G显存即可流畅运行,大幅降低视频创作门槛。支持中英文输入及多种风格,在运动连贯性和语义遵循方面达到商用水平,已在元宝平台、Hugging Face和GitHub开放体验。

爱力方 2025-11-21 14:30
13
0

腾讯混元

腾讯混元

2025-09-15 15:14
36
0