近日,白山云科技推出了一项特别的优惠活动,为新注册用户提供450元的大模型API体验金,但名额仅限前500名。
新注册用户只需完成实名认证,即可自动获得150元体验金,存入账户余额。更令人兴奋的是,当用户首次尝试平台上的模型服务后,还将额外获得300元体验金,该金额将在3个工作日内发放至账户。
此次活动中,白山云科技正式发布了其“大模型API”产品,并首批上线了多个大语言模型,如DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B以及Qwen3-32B-FP8等。借助白山云遍布全球的边缘云架构,这些API接口服务不仅超低延时、超稳定,而且使用简便,大大降低了大模型的应用成本和开发门槛,为企业和个人用户快速启动AI创新之旅提供了强有力的支持。
白山云专注于边缘推理领域,致力于构建“云边端”算力协同的新模式。面对多模态交互、多轮会话等复杂场景的爆发,传统集中式数据中心的算力供给模式已难以满足需求,网络时延和算力成本问题日益凸显。因此,白山云通过分布式算力下沉与智能调度,提供了更低延时、更优成本的边缘算力推理方案,推动了AI从集中式智能向全域协同智能的转变。
为了满足边缘推理场景的需求,白山云基于全球超过1700个边缘节点构成的算力网络,推出了“边缘算力云平台”,并持续进行升级和完善。该平台提供了一站式AI算力基础设施,覆盖从GPU算力资源到MaaS模型服务的全方位需求,为用户提供高性能、低成本的AI解决方案。
在模型服务方面,白山云提供了预构建、开箱即用的LLM和多模态模型服务,用户只需一行代码即可完成模型切换与集成。同时,借助边缘节点的就近推理能力,用户可以享受到低于300ms的超低延时推理体验。GPU算力服务也提供了多种选择,包括GPU容器、弹性容器和裸金属产品,灵活满足客户的不同需求。
为了重构“低延时、高稳定、强安全”的性能上限,白山云采用了多项先进技术。服务网关全网调度技术可以根据实时网络状况、节点负载和模型需求,将推理任务动态分发至最优的边缘节点,实现就近计算,大幅提升推理响应效率。异构算力弹性调度技术则通过多级弹性扩缩容能力,支持百万级并发,推理实例启动时间缩短至5秒内。
白山云还利用多区域管理的分布式缓存技术,对大模型文件进行数据集编排与亲和性调度,大幅提升了服务调度效率。同时,在单节点上对推理任务进行PD分离和并行计算,通过多卡多模型混跑,进一步提升了GPU利用率和模型推理效率。在安全性方面,白山云融合了全球边缘云平台的安全防护能力,为用户提供全方位的安全保障。
白山云CEO霍涛表示:“边缘算力正逐步从‘流量节点’向‘智能计算单元’进化,这种深度融合正是下一代AI基础设施的核心范式。白山云依托覆盖全球60多个国家与地区的边缘网络,正致力于构建日均万亿Token级推理处理的边缘智能平台。通过‘本地推理+云端协同’的混合架构,我们将边缘算力的价值渗透到工业质检、智能驾驶等20多个垂直场景,切实解决了企业在智能化转型中面临的实时性挑战和算力成本问题。”