2026年5月25日星期一

腾讯混元开源Hy-MT2翻译模型:1。8B/7B/30B三种尺寸,支持33种语言互译

腾讯混元开源Hy-MT2多语言翻译模型家族,包含1.8B、7B和30B-A3B三种尺寸,支持33种语言互译及翻译指令跟随。1.8B模型经1.25bit量化后仅440MB,推理速度提升1.5倍,适合端侧部署。评测显示7B/30B模型在快思考模式下超越DeepSeek-V4-Pro等开源模型,1.8B优于微软、豆包等商业API。开源免费,适合开发者、企业及科研场景使用。

Tags:

点击下方名片关注AIGC Studio公众号获取最新AI前沿应用/AIGC实践教程
扫描下方二维码,加入AIGC Studio知识星球可以获得最新AI前沿应用/AIGC实践教程/大厂面试经验/算法刷题IT各学科入门到精通学习资料学习/科研/工作/副业,强烈推荐!
图片

Hy-MT2是一款面向复杂真实场景的快思考多语言翻译模型家族,包含1.8B、7B和30B-A3B(MoE)三种尺寸,支持33种语言互译及多语言翻译指令跟随。其1.8B模型经AngelSlim 1.25bit极致量化后仅需440MB存储,推理速度提升1.5x,适合端侧部署。多维度评测表明,Hy-MT2在通用、商务、领域及指令遵循翻译任务上均表现卓越:7B和30B模型在快思考模式下超越DeepSeek-V4-Pro、Kimi K2.6等开源模型,1.8B模型整体也优于微软、豆包等主流商业API,实现了性能与效率的双重突破。

图片

模型特点

  • 支持多种语言:支持 33 种语言之间的互译,包括少数民族语言和汉语。

  • 行业领先的性能:在 Flores200 和 WMT25 等开源基准测试中表现出色,在专业领域和真实业务场景中均有卓越的执行力。

  • 优秀的翻译指导遵循:支持翻译场景中常见的指令执行任务,包括结构化翻译、基于分隔符的翻译、上下文翻译、基于词汇表的翻译和风格适应性翻译。

图片

unsetunset相关链接unsetunset

  • 论文:https://arxiv.org/pdf/2605.22064
  • 主页:https://aistudio.tencent.com/llm/en?tabIndex=0
  • 代码:https://github.com/Tencent-Hunyuan/Hy-MT2
  • 试用:https://aistudio.tencent.com
图片

unsetunset论文介绍unsetunset

图片Hy-MT2 是一系列专为复杂实际场景设计的“快速思考”多语言翻译模型。它包含三种模型规模:1.8B、7B 和 30B-A3B (MoE),均支持 33 种语言之间的互译,并能有效执行多语言的翻译指令。对于设备端部署,AngelSlim 1.25 位极限量化技术将 1.8B 模型的存储空间需求降低至仅 440 MB,并将推理速度提升 1.5 倍。多维度评估表明,Hy-MT2 在通用翻译、实际业务翻译、领域特定翻译和指令执行翻译任务中均表现出色。在快速思考模式下,7B 和 30B-A3B 模型的性能优于 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型,而轻量级的 1.8B 模型在整体性能上也超越了微软和豆宝等主流商业 API。

unsetunset技术细节unsetunset

图片

在CPT阶段,通过收集大量单语和双语/多语数据,并进行质量筛选和比例调整,显著提升了基础模型的翻译能力。在训练后阶段,通过策略内提炼和强化训练,进一步增强了模型的翻译指令执行能力和翻译效果。

unsetunset基准unsetunset

图片
  • 在一般翻译、专业领域翻译和实际业务场景中,Hy-MT2 系列模型均表现出色。值得注意的是,7B 和 A3B 型号的性能优于 DSV4 和 Kimi K2.6 等功能强大的开源模型,而轻量级的 1.8B 型号整体性能也超越了 Microsoft Translator 和豆宝翻译等商业翻译 API。

  • 在指令遵循能力方面:Hy-MT2 系列的一般指令遵循能力与其他同尺寸的型号相当,而在与翻译任务相关的指令遵循能力方面远远超过它们。

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

图片

没有评论:

发表评论

腾讯开源MegaStyle:140万风格数据集+风格迁移新SOTA,模型代码已公开

腾讯联合同济等高校提出MegaStyle,通过可扩展数据流水线构建140万张高清风格数据集MegaStyle-1.4M,训练出风格迁移模型MegaStyle-FLUX和编码器MegaStyle-Encoder,在多个基准上超越现有方法。论文、代码、模型、数据集全部开源,适用于插画...