白山云推出大模型API，重构AI推理体验，实现超低延时高效能_科技资讯

白山云推出大模型API，重构AI推理体验，实现超低延时高效能

创始人

2025-07-03 01:41:12

0次

近日，白山云科技推出了一项特别的优惠活动，为新注册用户提供450元的大模型API体验金，但名额仅限前500名。

新注册用户只需完成实名认证，即可自动获得150元体验金，存入账户余额。更令人兴奋的是，当用户首次尝试平台上的模型服务后，还将额外获得300元体验金，该金额将在3个工作日内发放至账户。

此次活动中，白山云科技正式发布了其“大模型API”产品，并首批上线了多个大语言模型，如DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B以及Qwen3-32B-FP8等。借助白山云遍布全球的边缘云架构，这些API接口服务不仅超低延时、超稳定，而且使用简便，大大降低了大模型的应用成本和开发门槛，为企业和个人用户快速启动AI创新之旅提供了强有力的支持。

白山云专注于边缘推理领域，致力于构建“云边端”算力协同的新模式。面对多模态交互、多轮会话等复杂场景的爆发，传统集中式数据中心的算力供给模式已难以满足需求，网络时延和算力成本问题日益凸显。因此，白山云通过分布式算力下沉与智能调度，提供了更低延时、更优成本的边缘算力推理方案，推动了AI从集中式智能向全域协同智能的转变。

为了满足边缘推理场景的需求，白山云基于全球超过1700个边缘节点构成的算力网络，推出了“边缘算力云平台”，并持续进行升级和完善。该平台提供了一站式AI算力基础设施，覆盖从GPU算力资源到MaaS模型服务的全方位需求，为用户提供高性能、低成本的AI解决方案。

在模型服务方面，白山云提供了预构建、开箱即用的LLM和多模态模型服务，用户只需一行代码即可完成模型切换与集成。同时，借助边缘节点的就近推理能力，用户可以享受到低于300ms的超低延时推理体验。GPU算力服务也提供了多种选择，包括GPU容器、弹性容器和裸金属产品，灵活满足客户的不同需求。

为了重构“低延时、高稳定、强安全”的性能上限，白山云采用了多项先进技术。服务网关全网调度技术可以根据实时网络状况、节点负载和模型需求，将推理任务动态分发至最优的边缘节点，实现就近计算，大幅提升推理响应效率。异构算力弹性调度技术则通过多级弹性扩缩容能力，支持百万级并发，推理实例启动时间缩短至5秒内。

白山云还利用多区域管理的分布式缓存技术，对大模型文件进行数据集编排与亲和性调度，大幅提升了服务调度效率。同时，在单节点上对推理任务进行PD分离和并行计算，通过多卡多模型混跑，进一步提升了GPU利用率和模型推理效率。在安全性方面，白山云融合了全球边缘云平台的安全防护能力，为用户提供全方位的安全保障。

白山云CEO霍涛表示：“边缘算力正逐步从‘流量节点’向‘智能计算单元’进化，这种深度融合正是下一代AI基础设施的核心范式。白山云依托覆盖全球60多个国家与地区的边缘网络，正致力于构建日均万亿Token级推理处理的边缘智能平台。通过‘本地推理+云端协同’的混合架构，我们将边缘算力的价值渗透到工业质检、智能驾驶等20多个垂直场景，切实解决了企业在智能化转型中面临的实时性挑战和算力成本问题。”

上一篇：Switch 2 迎来夏日烤验：掌机散热不足，风扇噪声引不满

下一篇：OPPO申请成像设备专利，动态改变合成图像

白山云推出大模型API，重构AI推理体验，实现超低延时高效能

相关内容

热门资讯