基于云边协同的分布式推理网络架构与赋能
创始人
2025-07-02 07:41:21
0

通信世界网消息(CWW)人工智能(AI)领域正经历深刻变革,核心驱动力之一是DeepSeek等大语言模型(LLM)的成熟与广泛应用。这些模型在展现强大能力的同时,也推动市场算力需求发生巨变。过去,AI算力的投入高度集中于模型预训练阶段,训练千亿或万亿参数规模的AI模型需要消耗海量样本数据与庞大计算资源;而DeepSeek通过“算法+工程”创新提升模型推理能力与效率,将推理成本压缩至OpenAI同类模型的1/40~1/30,API调用价格仅为行业标准的3%~5%,这使中小型企业和开发者能以更低成本获取强大AI能力,算力需求重心由“训练侧”快速向“推理侧”倾斜,预计到2027年推理负载占比将达到72.6%。

DeepSeek的开源模式大幅降低了AI应用门槛,用户推理需求激增。据统计,DeepSeek上线20天累计新增用户1.25亿户,日活用户数超2000万,今年1月28日的单日访问量高达4900万次。但高并发访问请求导致服务器资源迅速耗尽,用户访问DeepSeek网页时经常遇到“服务器繁忙,请稍后再试”的提示。2月6日DeepSeek官方宣布,由于服务器资源紧张,已暂停API服务充值功能。针对企业私有算力有限、难以满足海量用户并发推理需求的问题,运营商亟须利用自有网络资源、算力资源以及边缘计算能力,构建全新分布式推理架构,通过多节点云边协同,为用户提供无处不在的低时延推理服务。

……

点此阅读杂志全文

相关内容

热门资讯

原创 M... 据外媒报道,Meta 再次从 OpenAI 挖角四名研究员,这一举动引发了业界的广泛关注。此次被挖走...
临沂制造业新视角:老板人设成短... 在临沂这片制造业蓬勃发展的土地上,短视频运营正为企业带来前所未有的机遇。而近期雷军相关热点事件,也让...
专业AR开发公司:打造沉浸式未... 在现实与虚拟的交汇点上,AR(增强现实)已不再是科幻中的产物,而成为推动教育、医疗、制造、营销等多个...
AI赋能假日经济,“人工智能+... 近年来,随着人工智能(AI)技术的迅猛发展,越来越多的行业正在发生深刻的变革,尤其是在假日经济这一领...
工业软件扎根 济南高新区构建创... 在数字经济蓬勃发展的当下,软件可以称之为新一代信息技术的核心,更是支撑制造强国、网络强国与数字中国建...
如何看待AI“一本正经地胡说八... 【现象】使用人工智能大模型时,不少人或许都遇到过类似问题:它们有时会捏造细节,甚至“一本正经地胡说八...
打造全球双万兆之城,上海电信如... 你有没有想过,为什么在黄浦江游轮上刷视频,再也不会卡顿?为什么家里的8K电影、云游戏、AI管家,能同...
最新!数字人民币+XBIT挑战... 最新消息!数字人民币 XBIT 正以强劲之势向美元稳定币霸权发起挑战。在当今数字货币领域,数字人民币...
中山展晖电子取得一种磁环供料机... 金融界2025年7月2日消息,国家知识产权局信息显示,中山展晖电子设备有限公司取得一项名为“一种磁环...
曝OPPO K13系列新机本月... 【CNMO科技消息】7月2日,有数码博主曝光了OPPO K13系列新机的信息。CNMO了解到,该机有...