当前位置: 首页 > news >正文

腾讯混元全新翻译模型Hy-MT2开源,小程序「腾讯Hy翻译」开放体验

Hy-MT2是支持 33 种语言互译的多语言模型,其中7B和30B-A3B模型在各类翻译任务上达到了开源模型最佳效果,超越了几十倍参数量的模型。轻量级的1.8B 模型也超越了微软等主流商业API,且得益于AngelSlim1.25-bit极端量化,仅需 440MB 存储空间,可以轻松部署在苹果、高通、联发科等手机芯片上支持本地推理,相比Hy-MT1.5推理速度提升 1.5 倍。

基于Hy-MT2模型的“腾讯Hy翻译”小程序已经上线,IOS和安卓APP即将上线(支持本地推理)。

今天,混元翻译模型Hy-MT2 正式开源。

Hy-MT2包含3个尺寸的模型Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B,三个模型均支持33个语种互译,5种民汉/方言。

相比上一代翻译模型Hy-MT1.5,Hy-MT2 效果提升明显,尤其在多语言指令遵循、专业领域翻译和真实应用场景翻译中表现较好,追平甚至超过大尺寸通用模型。

为了方便使用,我们也同时推出「腾讯Hy翻译」小程序,它基于Hy-MT2打造,相比其他翻译工具,不仅支持语音输入,还优化了自定义翻译风格和指令的能力,让翻译结果更符合预期,实用性更强。

用户不仅可以在联网环境下体验高速版的混元翻译模型,也可以通过提前下载端侧翻译模型,在无网络或者弱网络场景中使用离线翻译,解决了部分应用场景中网络条件受限的问题。

马上体验👇(欢迎在小程序评论区给我们反馈使用体验,我们将抽取5位用户送出定制礼物~)

此外,腾讯Hy翻译APP也正在上架中,将很快会对外提供服务。

在端侧场景下Hy-MT2进一步探索极低比特量化方案,本次升级模型中,极低比特量化版(1.25-bit)仅需约 440MB 存储空间即可部署,这也为翻译模型接入端侧智能设备做好了技术准备。

通用翻译能力出众,重点优化专业领域和真实业务场景

在通用翻译能力评测中,Hy-MT2系列三个模型在 FLORES-200 平均表现上分别达到目前行业表现最好的翻译模型 (Gemini 3.1 Pro )的 88.1%、 96.9%,和 98.1%水平,已经十分接近。同时,Hy-MT2-7B和 Hy-MT2-30B-A3B 的实测得分超过 DeepSeek-V4-Pro和Kimi K2.6等开源模型。在轻量级模型的横向对比中,Hy-MT2-1.8B 也整体优于头部商业翻译 API。

在保持通用翻译能力的同时,Hy-MT2进一步面向真实业务场景和专业领域翻译进行优化。可以看到,在真实场景测试集上,Hy-MT2-1.8B 和 Hy-MT2-7B 的 GEMBA 评分(基于大语言模型的翻译质量自动评估指标)分别达到 Gemini 3.1 Pro 的 96.7% 和 99.9%水平,并且这一场景下Hy-MT2-30B-A3B 效果已经超过 Gemini 3.1 Pro。

在涵盖 8 个专业领域的 DomainMTBench 上,三个模型的 GEMBA 评分分别达到 Gemini 3.1 Pro 的 96.2%、97.9% 和 99.0%水平,几乎持平。另外可以看到,Hy-MT2-30B-A3B在金融、政治、教育几个垂直领域的翻译表现已经部分超过主流翻译模型。

相比上一版本模型,Hy-MT2的最大提升体现在指令遵循能力上,模型能够更准确地理解并执行用户关于术语、风格和输出格式等方面的具体要求。腾讯混元自建数据集IFMTBench测试结果表明,Hy-MT2-7B和 Hy-MT2-30B-A3B的翻译效果已经超越等相近尺寸开源模型,接近 Gemini 3.1 Pro。

IFMTBench也随着模型发布一并开源,这是一个翻译指令遵循测试集,测试集中的指令主要是和翻译任务相关,例如翻译风格变换、指定术语翻译等,指令和待翻译的文本涵盖了多个语种。

例如下面的例子,通过“个性化设定:翻译结果简洁精炼,去掉冗余表达,每句不超过15个字”,模型可以很好的遵循指令,让翻译结果更符合要求。

总体看来,Hy-MT2是一个面向真实应用场景的高质量、高效率、多能力多语翻译模型家族,在通用翻译、专业领域翻译、真实业务场景和翻译指令遵循任务上均表现出较强竞争力。

架构创新和极致量化:极低比特量化版本仅需约 440MB 即可部署

跟此前模型不一样的是,为在翻译效果和推理效率之间取得更好的平衡,Hy-MT2首次引入混合专家架构,推出 Hy-MT2-30B-A3B,通过扩大总参数规模提升模型容量,同时控制每次推理时的激活参数量,在增强翻译质量的同时降低推理开销,相比单纯扩大稠密模型规模,这种设计更适合面向真实应用场景的高质量翻译系统。

此外,上一版本的模型Hy-MT1.5-1.8B虽已提供 4-bit量化版本,但该版本仍需要 1GB 以上的存储空间,在移动端、边缘设备和其他资源受限环境中存在一定部署压力,并且其推理速度也难以充分满足部分低延迟翻译场景的需求。

针对这些问题,Hy-MT2进一步探索极低比特量化方案。除4-bit、8-bit 和 FP16 版本外,Hy-MT2还基于混元自研技术提供了 1.25-bit和2-bit版本,以适配不同硬件环境下的部署需求。特别地,基于混元自研Sherry 框架实现的1.25-bit 极低比特量化版本仅需约 440MB 存储空间即可部署,并且在苹果 A15 上的推理速度相比 Hy-MT1.5 的 4-bit 量化版本提升了 1.5 倍,进一步提升了实际可用性。

为了便于开发者使用,Hy-MT2 开源的模型已经在 Github和Huggingface等开源社区上线,ARM、高通、Intel、沐曦、天数智芯等多个平台均支持部署。

从 Hy-MT1.5到Hy-MT2,一次围绕真实反馈进行的系统升级

Hy-MT1.5发布后,在开源社区和实际业务使用中受到了广泛关注,随着模型被应用到更多真实翻译场景中,社区和业务反馈也暴露出 Hy-MT1.5 的一些不足。Hy-MT1.5 能够较好地支持通用多语翻译任务,但在专业领域翻译、真实业务场景翻译、翻译指令遵循以及端侧高效部署等方面仍存在进一步提升空间。

这些反馈表明,面向真实应用的多语翻译模型需要更系统地覆盖专业领域和真实业务场景,更稳定地执行关于术语、风格和格式等方面的翻译指令,同时在资源受限设备上具备更低的部署成本和更高的推理效率。

基于这一目标,腾讯混元基于技术上的改进和升级推出了Hy-MT2 系列模型。总体而言,Hy-MT2 不止是对 Hy-MT1.5 的简单规模扩展,而是一次围绕真实反馈进行的系统升级。针对 Hy-MT1.5 在专业领域翻译、真实场景翻译、翻译指令遵循、与最强闭源模型的性能差距以及端侧高效部署等方面的不足,Hy-MT2 从能力增强、混合专家架构和极低比特量化部署等方面进行改进,目标是构建一个更加适合真实应用场景的高质量、高效率、多能力多语翻译模型族。

腾讯混元翻译模型坚持从社区和实际应用场景中搜集真实反馈,不断提升模型能力,同时,腾讯混元也希望通过开源和社区活动回馈社区,现在,腾讯混元也在与WMT26官方合作「视频字幕翻译比赛],使用Hy-MT系列模型参与「通用机器翻译比赛」和「视频字幕翻译比赛」有机会获得混元特设奖励,诚邀邀大家参与,共同推动机器翻译前沿技术发展。

  • WMT26「视频字幕翻译比赛]:

    https://www2.statmt.org/wmt26/video-subtitle-translation.html

  • WMT26「通用机器翻译赛」:

    https://www2.statmt.org/wmt26/translation-task.html

体验链接和开源地址:

  • HuggingFace:https://huggingface.co/collections/tencent/hy-mt2

  • Modelscope:https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2

  • Github:https://github.com/Tencent-Hunyuan/Hy-MT2

  • 腾讯云:https://console.cloud.tencent.com/tokenhub/text

  • 腾讯混元官网:https://aistudio.tencent.com/llm/zh?tabIndex=0

关注腾讯开源公众号

获取更多最新腾讯官方开源信息!

点击👇【阅读原文】,访问Hy Research,了解更多技术细节。

http://www.zskr.cn/news/1361475.html

相关文章:

  • 如何快速下载微信视频号、抖音、小红书等平台资源?这款开源工具帮你搞定!
  • 如何用开源工具实现自动化硬件适配?OpCore-Simplify让跨平台部署变得简单
  • COMET神经网络翻译评估框架:架构设计与技术实现深度解析
  • 抖音下载神器:5步掌握批量下载的终极指南
  • Java并发编程:ReentrantLock与AQS原理剖析
  • 从 MacBook Air 到机器人:Caitlin Kalinowski 谈「硬件只有五次编译机会」
  • gcc下载地址
  • 开发商做一套售楼处数字沙盘 多少钱 都包含什么
  • 共享内存(零拷贝)** —— 这是 PyTorch 和 NumPy 之间最高效的特殊机制!
  • SQL 能包打天下吗?多少比例的产品只需 SQL,何时需要引入其他存储?
  • 实际开发中 SQL 与产品的耦合与互动实践
  • 三亚夜市哪家最有特色 - 资讯纵览
  • 非结构化上下文演化下基于上下文老虎机的在线多LLM选择
  • 混合精度优化在LLM推理加速中的实践与调优
  • 电商内容破局:易元AI爆款复刻Agent,抄结构而非抄内容,高效打造高转化素材
  • 解决Flex浮动许可证导致的Arm编译器构建延迟问题
  • 清远厂房搬家公司哪家专业靠谱?TOP5收费标准与避坑指南 - 从来都是英雄出少年
  • Keil C166嵌入式开发中的宽字符实现与优化
  • 量子计算中的SWAP门原理与应用解析
  • 多模态AI系统:从认知到执行的智能闭环设计
  • 飞行人形机器人空气动力学建模与CFD仿真实践
  • Vitis HLS优化指令与iDSE智能设计空间探索框架解析
  • 8051中断系统与INT0调试技巧详解
  • Python、BMA-Stacking融合LightGBM、GBDT、KNN多模型电商交易欺诈风险预警研究|附代码数据
  • AI赋能 绿色未来 —— 华硕重磅亮相第二十八届海峡两岸经贸交易会
  • Eclipse 内置浏览器详解
  • 为什么iPhone微信聊天记录搜不到“?“,而安卓可以。
  • 面向心理咨询 Agent 的 Harness 危机关键词拦截
  • 【实用程序】AI后端驱动的文字MUD江湖游戏设计
  • 5个技巧让你用Python零成本获取A股专业数据