破解AI“安全与性能”难题:华为浙大发布DeepSeek-R1-Safe大模型
创始人
2025-09-21 14:01:17
0

IT之家 9 月 21 日消息,在 9 月 18 日的华为全联接大会 2025 上,华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Safe 基础大模型。

浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎详细介绍了 DeepSeek-R1-Safe-671B 基础大模型的核心创新。

据介绍,研发团队从底层入手,构建了一套覆盖“高质量安全语料 — 平衡优化的安全训练 — 全链路自主创新软硬件平台”的全流程安全后训练框架。

在算力平台搭建方面,团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练,系统性地解决了训练环境中的关键问题,构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。

测试结果表明,DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等 14 个维度的普通有害问题整体防御成功率近 100%,针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过 40%。其综合安全防御能力达 83%,在同样测试设置下超过 Qwen-235B 和 DeepSeek-R1-671B 等多个同期模型 8% 至 15%。

此外,在 MMLU、GSM8K、CEVAL 等通用能力基准测试中,DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能损耗在 1% 以内。这些结果表明 DeepSeek-R1-Safe 不仅显著提升了安全防护能力,也保障了模型的可用性,达成了安全能力与通用性能之间的有效平衡。

▲ 任奎

中国工程院院士陈纯指出,浙江大学计算机科学与技术学院已组建起一支涵盖多位海内外优秀青年人才的科研团队,并已成功依托昇腾生态,实现了自主全流程后训练框架,完成了国内首次千卡集群大模型安全训练。这次 DeepSeek-R1-Safe 的发布旨在打造安全可信的示范应用,推动大模型安全能力与产业生态协同发展。他表示希望团队未来与华为展开更深入合作,共同推动我国 AI 技术进步。

华为昇腾计算业务总裁张迪煊表示,华为在此次大会上也正式推出了昇腾新一代 AI 硬件与全系列软件开源开放战略,覆盖编译器、运行时驱动等核心组件,致力于通过深度开放协作,联合高校与产业伙伴共同推动基础软件创新与 AI 安全能力建设。

IT之家注意到,该模型已在 ModelZoo、GitCode、GitHub、Gitee 及 ModelScope 等多个社区全面开源。

  • Gitee 地址:https://gitee.com/ZJUsafe/deep-seek-r1-safe
  • GitHub 地址:https://github.com/ZJUAISafety/DeepSeek-R1-Safe

相关内容

热门资讯

确认了:印军36架,将全部退役 据印度亚洲国际新闻社(ANI)、美国消费者新闻与商业频道(CNBC)等媒体报道,印度空军将于9月26...
喜马拉雅山烟花秀被指“炸山”,... 极目新闻记者 丁伟9月19日,户外品牌始祖鸟联手艺术家蔡国强在喜马拉雅山进行烟花秀,被指破坏高原生态...
人单合一20年:构建AI时代的... 9月19日,由商业生态联盟(BEA)、海尔集团、加里·哈默管理实验室(MLab)联合主办的第九届人单...
原创 最... 距离2026年还有三个月左右的时间,中国新能源汽车市场即将迎来一个重大转折点:新能源车购置税减免政策...
社交平台宣称的可抗癌、降三高的... 近段时间以来,“哈佛蔬菜汤”在社交平台上持续走红,它以卷心菜、洋葱、南瓜、胡萝卜四种蔬菜为原料制作而...
迈向一个世界级AI应用创新集聚... AI应用商店、未来餐饮工坊、时空漫游巴士……高度320米的张江科学之门周边区域,正在以AI应用场景为...
就够牛了“wepoker可以... 您好:wepoker这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多...
来把牛牛吧“临汾斗地主别拼了... 您好:临汾斗地主这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家...
华为坤灵智能医疗场景方案评测:... 医疗数据是医院运营的核心资产,安全、高效、易维护的IT系统,直接关系到诊疗效率与患者体验。 近日,2...
大促快讯“163棋牌有透视挂... 您好:163棋牌这款游戏可以开-挂,确实是有-挂的,需要了解加客服微信【176594599】很多玩家...