DeepSeek-V3.2上线国家超算互联网 开发者可免费下载
创始人
2025-09-30 21:21:21
0

IT时报记者 孙妍

9月30日,依托国产深算智能加速卡以及全国一体化算力网,DeepSeek-V3.2-Exp上线国家超算互联网AI社区,企业和开发者均可在AI社区免费下载DeepSeek-V3.2-Exp模型文件进行快速开发。

9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性的版本。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeekSparseAttention(DSA,一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

DeepSeekSparseAttention首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

目前,超算互联网AI社区已汇聚700余款国内外优质开源模型,包括DeepSeek-V3.1-Terminus、DeepSeek-R1-0528、DeepSeek-R1、DeepSeek-V3等DeepSeek系列,开发者可登录超算互联网AI社区,实现API调用、Chatbot在线推理对话、国产大模型分布式训练、微调等功能于一体的MaaS服务。

相关内容

热门资讯

中国国民党主席选举最新民调曝光... 图源:台媒中国国民党主席将于本月18日进行改选,据台媒报道,昨天(2日)传出一份国民党全党员最新民调...
“政四代”却被嘲“废话大臣”,... 编者按日本自民党总裁选举将于10月4日开票,按照惯例,这场选举的胜出者大概率将出任日本新首相。在一众...
三大运营商均获卫星移动通信业务... 本报记者 李乔宇 9月29日,工业和信息化部官方微信“工信微报”发文称,工业和信息化部向中国移动通信...
海军航空兵节日期间战备巡逻飞行 国庆节日期间,海军航空兵某部组织战备巡逻飞行。期间,该部精心配强机组人员,组织官兵学习战备规定、熟悉...
贝泰妮获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示贝泰妮(300957)新获得一项实用新型专利授权,专利名为“一...
男子手拿折扇逛街却被看成持刀,... 极目新闻记者 刘毅10月1日晚,网传江西南昌红谷滩世贸路上有一赤膊男子持刀,被路人踹倒控制后交给民警...
是他,还是她?日本自民党总裁选... 作者 | 第一财经 潘寅茹封图 | 日本自民党总裁选举候选人(来源:新华社图)经过两周的备选,日本自...
当“药香”遇上“书香”,深技大... 深圳商报·读创客户端记者 张妍 通讯员 深平乐 9月25日是第十七届世界药师节,深圳技术大学的空气中...
因发现无人机踪迹,慕尼黑机场关... 在被迫关闭近7小时后,慕尼黑机场在当地时间3日凌晨5点重新开放。据新华社10月3日报道,由于多次发现...
中瑞两国科研人员联手绘制微生物... 植物生长与土壤中的微生物密不可分。植物根系与微生物之间如何互动和协作,是科学家努力破解的“地下谜题”...