DeepSeek春节再扔王炸?最新披露:正测试新模型结构
创始人
2026-02-15 17:20:57
0

2月13日,澎湃新闻记者获悉,DeepSeek 网页/ APP 正在测试新的长文本模型结构,支持 1M 上下文。其API 服务不变,仍为 V3.2,仅支持 128K 上下文。

这也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

今年1月12日,DeepSeek曾发布一篇新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大语言模型稀疏性的新维度),梁文锋位列作者名单中,这篇论文为北京大学和DeepSeek共同完成。据分析,这篇论文的核心直指当前大语言模型存在的记忆力“短板”,提出了“条件记忆”这一概念。

当时行业就普遍猜测,DeepSeek的下一代模型V4或将在今年春节前后正式发布。

去年12月1日,DeepSeek曾经同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新为正式版 DeepSeek-V3.2,Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

据介绍,DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent(智能体)任务场景。在公开的推理类Benchmark测试中,DeepSeek-V3.2达到GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少计算开销与用户等待时间。

相关内容

热门资讯

美军打击伊朗,报复商船遇袭事件 美国中央司令部6月27日于社交媒体平台“X”发文,称美军于6月26日对伊朗发动打击,以此强力回应前一...
美称设立军事协调小组协助落实美... △美国国务卿鲁比奥(资料图)当地时间6月26日,美国国务卿鲁比奥发布声明表示,当日,美国、黎巴嫩和以...
布基纳法索宣布与法国断交 △布基纳法索(资料图)当地时间6月26日,布基纳法索政府宣布,自当天起断绝与法国的外交关系。布政府表...
美以黎签署三方框架协议,细节披... 当地时间26日晚,一名以色列官员披露称,经过美国、以色列和黎巴嫩三方的会谈,三方代表当晚在美国签署了...
联合国官员:委内瑞拉强震后逾5... 财联社6月27日电,联合国分管人道主义事务的副秘书长兼紧急救援协调员汤姆·弗莱彻表示,在委内瑞拉发生...
伊朗否认伊美就霍尔木兹海峡问题... 当地时间26日,伊朗伊斯兰革命卫队发言人侯赛因·穆赫比表示,针对“伊朗与美国已就霍尔木兹海峡问题设立...
特朗普:伊朗违反了停火协议 财联社6月26日电,美国总统特朗普表示,美军击落了伊朗三架无人机。特朗普称伊朗在霍尔木兹海峡发动的无...
江阴祝塘:荣飞5G智能绿色工厂... 6月23日,江阴市祝塘镇重点数字化转型标杆项目——荣飞5G智能绿色工厂项目顺利完成主体封顶。该项目聚...
翔亚机械取得一种电梯按键专利,... 国家知识产权局信息显示,嘉兴市翔亚机械设备有限公司取得一项名为“一种电梯按键”的专利,授权公告号CN...
溧阳市博物馆一张展出照片被指系... 极目新闻记者 张奇 近日,有网友在社交网站反映,江苏常州溧阳市博物馆展出了使用AI技术生成的图片,其...