TAG:腾讯混元

 OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”

OCR的“轻骑兵”突袭:当腾讯混元,用10亿参数,重塑“文字识别”

腾讯混元开源全新OCR模型HunyuanOCR,仅10亿参数却斩获多项SOTA成绩。该模型采用端到端设计,在复杂文档解析、多场景文字检测识别中表现卓越,支持14种小语种翻译并荣获ICDAR2025冠军。轻量化架构便于部署,已应用于卡证处理、视频创作等场景,用户可通过GitHub和Hugging Face快速体验。

爱力方 2025-11-25 17:51
6
0

腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛

腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛

腾讯混元大模型团队发布全新视频生成模型HunyuanVideo1.5,这款基于DiT架构的轻量级模型参数量达8.3B,支持文生视频和图文结合生成动态视频。模型采用SSTA稀疏注意力机制,仅需14G显存即可流畅运行,大幅降低视频创作门槛。支持中英文输入及多种风格,在运动连贯性和语义遵循方面达到商用水平,已在元宝平台、Hugging Face和GitHub开放体验。

爱力方 2025-11-21 14:30
7
0

腾讯混元

腾讯混元

2025-09-15 15:14
36
0