近日,多位网友发现,DeepSeek已面向更多用户开放“识图模式”。
据了解,今年4月底,DeepSeek开启识图功能灰度测试,并于5月进一步扩大测试范围。虽然官方尚未正式发布公告,但DeepSeek多模态研究员陈小康6月18日在社交平台X发文也证实了这一消息:“Vision现已在网页端和App端上线。”
今年4月发布V4系列模型时,DeepSeek仍将推理和Agent能力作为核心卖点,并未将多模态列为重点方向。不过,V4发布后不久,公司便开始测试并逐步开放识图功能。
事实上,多模态已成为头部大模型产品的标配。ChatGPT、Gemini,以及国内的豆包、腾讯元宝、阿里千问等产品均已支持图像理解,字节跳动Seedance、快手可灵等产品则进一步拓展至视频生成领域。
相比之下,DeepSeek此前主要依靠V3、R1等模型在推理领域建立优势,主产品长期以文本交互为主。此次识图功能上线,意味着其能力边界正从文本推理向多模态延伸。
值得关注的是,在产品能力持续升级的同时,DeepSeek近期也被曝正推进成立以来首次大规模外部融资。据外媒报道,DeepSeek最新一轮融资规模超过500亿元人民币,投后估值超过500亿美元,成为中国估值最高的AI创业公司之一。
作者:操子怡