腾讯开源混元MT翻译模型系列
创始人
2025-09-11 21:43:52
0

腾讯控股有限公司今天开源了一个新的语言模型系列——混元MT系列,该系列专门针对翻译任务进行了优化。

这家中国科技公司表示,该算法在一个流行的人工智能翻译基准测试中显著超越了谷歌翻译的表现。

混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数。此外还有两个量化或压缩版本的算法,这些版本通过牺牲一些输出质量来降低内存使用量。

腾讯使用四个不同的数据集对模型进行初始训练。前两个数据集包含33种语言编写的文本片段,但不包含任何关于如何执行翻译的信息。另外两个数据集包含数百万个所谓的配对数据,这些记录各自包含一个文本片段和对应的翻译。

根据腾讯的介绍,训练流程不仅为其混元MT模型配备了翻译能力,还提供了大量的通用知识。该公司使用名为MMLU-Pro的通用知识基准测试对算法进行了测试。混元MT显著超越了拥有80亿参数的Llama-3-8B-Base模型。

腾讯在初始训练后进行了强化学习阶段。在项目的这一部分,公司为混元MT模型提供了一系列训练任务,并对其响应质量提供反馈。模型利用这些反馈来提高输出质量。

这种试错学习过程由一个定制的AI模型监督。该模型根据混元MT生成的翻译与原文的语义相似性来评分,同时还考虑其他因素,包括算法处理特定领域术语的能力。

混元MT系列中的第一个AI——混元MT-7B,基于标准的语言模型架构。混元MT-Chimera-7B使用了一种更复杂的处理方法,称为集成学习。

与专家混合模型类似,集成学习算法包含多个神经网络。但专家混合模型只使用其中一个神经网络来处理用户提示,而集成学习使用所有神经网络。它为提示生成多个答案,然后将它们组合成一个更高质量的单一响应。

腾讯使用名为WMT25的AI翻译基准将混元MT与谷歌翻译进行了比较。根据该公司的说法,其模型系列在测试评估的31个语言对中的30个表现更好。在某些情况下,混元MT的得分高出65%。

该模型系列还超越了其他几家AI提供商的算法。腾讯表示,混元MT在WMT25基准测试的大多数语言对中得分高于GPT-4.1和Anthropic公司的Claude 4 Sonnet。

Q&A

Q1:混元MT系列包含哪些模型?

A:混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数,此外还有两个量化或压缩版本的算法,这些版本通过牺牲一些输出质量来降低内存使用量。

Q2:混元MT在翻译基准测试中表现如何?

A:腾讯使用WMT25基准将混元MT与谷歌翻译进行比较,其模型系列在测试评估的31个语言对中的30个表现更好,在某些情况下得分高出65%。同时在大多数语言对中得分也高于GPT-4.1和Claude 4 Sonnet。

Q3:混元MT-Chimera-7B与混元MT-7B有什么区别?

A:混元MT-7B基于标准的语言模型架构,而混元MT-Chimera-7B使用了更复杂的集成学习处理方法。集成学习使用所有神经网络为提示生成多个答案,然后将它们组合成一个更高质量的单一响应。

相关内容

热门资讯

一分钟普及!欢乐吓牌真有挂吗... 您好:“欢乐吓牌这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家...
全民科普!一起宁德麻将到底有... 您好:“一起宁德麻将这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多...
全民秘籍!星悦广西麻将透视开... 有 亲,根据资深记者爆料星悦广西麻将是可以开挂的,确实有挂(咨询软件无需...
今日曝光!老友麻将真的有挂吗... 有亲,根据资深记者爆料老友麻将是可以开挂的,确实有挂(咨询软件无需打开直接加微835087887)您...
难怪一直输,微乐山东麻将如何... 有亲,根据资深记者爆料微乐山东麻将是可以开挂的,确实有挂(咨询软件无需打开直接加微835087887...
秒懂科学!来来来块块猫到底能... 需要了解加客服微信【176594599】智星德 州菠萝透视教程,wepoker辅助透视开挂,wepo...
十打十胜“广西老友玩就没输过... 您好:“这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家在这款游...
今日通报!微乐湖南麻将到底有... 有亲,根据资深记者爆料微乐湖南麻将是可以开挂的,确实有挂(咨询软件无需...
我来教大家“H9电玩开挂会不... 有亲,根据资深记者爆料H9电玩是可以开挂的,确实有挂(咨询软件无需打开直接加微1...
《必看实力》四海互娱有挂吗辅... 您好:四海互娱这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家在...