破解AI“安全与性能”难题：华为浙大发布DeepSeek-R1-Safe大模型_科技资讯

破解AI“安全与性能”难题：华为浙大发布DeepSeek-R1-Safe大模型

创始人

2025-09-21 14:01:17

0次

IT之家 9 月 21 日消息，在 9 月 18 日的华为全联接大会 2025 上，华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Safe 基础大模型。

浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了 DeepSeek-R1-Safe-671B 基础大模型的核心创新。

据介绍，研发团队从底层入手，构建了一套覆盖“高质量安全语料 — 平衡优化的安全训练 — 全链路自主创新软硬件平台”的全流程安全后训练框架。

在算力平台搭建方面，团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练，系统性地解决了训练环境中的关键问题，构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。

测试结果表明，DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等 14 个维度的普通有害问题整体防御成功率近 100%，针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过 40%。其综合安全防御能力达 83%，在同样测试设置下超过 Qwen-235B 和 DeepSeek-R1-671B 等多个同期模型 8% 至 15%。

此外，在 MMLU、GSM8K、CEVAL 等通用能力基准测试中，DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能损耗在 1% 以内。这些结果表明 DeepSeek-R1-Safe 不仅显著提升了安全防护能力，也保障了模型的可用性，达成了安全能力与通用性能之间的有效平衡。

▲ 任奎

中国工程院院士陈纯指出，浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队，并已成功依托昇腾生态，实现了自主全流程后训练框架，完成了国内首次千卡集群大模型安全训练。这次 DeepSeek-R1-Safe 的发布旨在打造安全可信的示范应用，推动大模型安全能力与产业生态协同发展。他表示希望团队未来与华为展开更深入合作，共同推动我国 AI 技术进步。

华为昇腾计算业务总裁张迪煊表示，华为在此次大会上也正式推出了昇腾新一代 AI 硬件与全系列软件开源开放战略，覆盖编译器、运行时驱动等核心组件，致力于通过深度开放协作，联合高校与产业伙伴共同推动基础软件创新与 AI 安全能力建设。

IT之家注意到，该模型已在 ModelZoo、GitCode、GitHub、Gitee 及 ModelScope 等多个社区全面开源。

Gitee 地址：https://gitee.com/ZJUsafe/deep-seek-r1-safe。
GitHub 地址：https://github.com/ZJUAISafety/DeepSeek-R1-Safe

上一篇： 五大秘诀!欢乐华东游戏总输怎么办/轻松逆袭赢牌局

下一篇：牵手阿里巴巴，余杭又有新布局！

破解AI“安全与性能”难题：华为浙大发布DeepSeek-R1-Safe大模型

相关内容

热门资讯