谷歌最强开放翻译模型:TranslateGemma登场,手机也能跑
创始人
2026-01-16 12:40:23
0

IT之家 1 月 16 日消息,谷歌昨日(1 月 15 日)发布博文,基于 Gemma 3 架构,推出 TranslateGemma 开放翻译模型系列,共有 4B、12B 和 27B 三种参数规模,支持 55 种核心语言及多模态图像翻译,目前已在 Kaggle 和 Hugging Face 开放下载。

性能方面,谷歌团队利用 WMT24++ 基准(包含高、中、低资源语言的 55 种语言)和 MetricX 指标进行了严格测试。

结果显示,TranslateGemma 12B 版本的翻译质量超越了参数量大其两倍的 Gemma 3 27B 基线模型。这意味着开发者仅需消耗一半的算力资源,即可获得更高保真的翻译结果,从而大幅提升吞吐量并降低延迟。

同时,体量最小的 4B 模型也展现出惊人实力,其性能与 12B 基线模型相当,为移动端和边缘计算设备提供了强大的翻译能力。

技术方面,TranslateGemma 的高密度智能源于独特的“两阶段微调”工艺。

首先是监督微调(SFT),Google 利用 Gemini 模型生成的高质量合成数据与人工翻译数据混合,对 Gemma 3 底座进行训练;随后引入强化学习(RL)阶段,通过 MetricX-QE 和 AutoMQM 等先进奖励模型,引导模型生成更符合语境、更自然的译文。

在语言覆盖方面,TranslateGemma 重点优化并验证了 55 种核心语言(涵盖西班牙语、中文、印地语等),并进一步探索训练近 500 种语言,为学术界研究濒危语言提供了坚实基础。

此外,得益于 Gemma 3 的架构优势,新模型完整保留了多模态能力。测试表明,无需额外针对视觉任务进行微调,其在文本翻译上的提升直接增强了图像内文字的翻译效果。

为了适应不同的开发需求,TranslateGemma 的三种尺寸对应了精准的部署场景:

  • 4B 模型专为手机和边缘设备优化,实现端侧高效推理;
  • 12B 模型适配消费级笔记本电脑,让本地开发具备研究级性能;
  • 27B 模型则面向追求极致质量的场景,可运行于单张 H100 GPU 或云端 TPU 上。

所有模型目前均已在 Kaggle、Hugging Face 及 Vertex AI 上线。

IT之家附上参考地址

相关内容

热门资讯

老登不退场,西贝很难救 老贾这是不死不休了。1月15日,西贝餐饮创始人贾国龙在朋友圈发文称,“遭到铺天盖地的污蔑125天,一...
广东如何再次勇立潮头? 在2026年国际消费电子展上,来自广东的新消费电子产品成为了本次展会的一大亮点。受访者供图 从大模型...
阿里正把自己装进赛博分身 出品|虎嗅商业消费组 作者|苗正卿 题图|视觉中国 阿里杭州西溪园区,C区C4楼,三层、四层。 四层...
长期在火车站跟随、挥手揽客,3... 澎湃新闻记者 邹桥 通讯员 叶仲文临近春运,上海松江站客流大幅增加,“黑车”司机在出站口揽客的情况开...
打破 20 年技术僵局,西电团... 1 月 16 日消息,据西安电子科技大学官方公众号 1 月 13 日报道,西安电子科技大学团队打破 ...
出货量登顶后的真相,人形机器人... 文 | 松果财经,作者 | 琴声奏响时 当智元以超过5100台的出货量,占据接近四成的全球市场份额...
谷歌Pixel 10a手机被曝... IT之家 1 月 16 日消息,消息源 @MysteryLupin 于 1 月 14 日在 X 平台...
欧洲派兵1+2+13…白宫:已... 【文/观察者网 齐倩】美国持续发出吞并威胁,丹麦和格陵兰岛“弱小无助”,欧洲国家开始“挺身而出”。近...
产研同心,淀粉成“金” □ 本报记者 叶 真 优化重塑国家大学科技园,系统布局概念验证、中试验证平台及各类新型研发机构,加大...
聚焦高质量发展|福州高新区点燃... 图为蓬勃发展的福州高新区。新华网发(福州高新区管委会供图) 近日,工业和信息化部公布2025年国家高...