将整个工作负载从一个云平台迁移到另一个云平台并非易事。
基础设施即代码技术的事实标准Terraform本来是为了让基础设施在云提供商之间具有可移植性而设计的。然而现实情况更加复杂且往往令人痛苦。每个云提供商都使用自己的资源方言,迁移需要数月的手动重写,而那些声称能够生成生产就绪基础设施即代码的AI工具在网络、身份访问管理和服务依赖方面仍然表现不佳。
FluidCloud是一家位于加利福尼亚州普莱森顿的初创公司,于2025年7月获得810万美元种子轮融资并走出隐身模式,正在推出他们称为大型基础设施模型的技术。大型基础设施模型是一个专门构建的AI引擎,用于在多云环境中生成、翻译和验证Terraform。该公司认为,扫描云环境并生成基础设施即代码与实际能够将该基础设施迁移到另一个提供商是不同的。
FluidCloud联合创始人兼首席执行官Sharad Kumar对Network World表示:"市场上大多数公司在扫描云环境并生成基础设施即代码时,都称之为弹性。真正的弹性是如果你有能力将其迁移到其他地方。你可以将其迁移到另一个区域,可以迁移到另一个云提供商。这样我才能称之为真正的弹性。"
大型基础设施模型的架构设计
使用大语言模型然后针对特定用例进行微调的想法并不新鲜,这正是各行各业现在获得具有适用领域知识的高级AI工作方式。
大型基础设施模型背后的架构与大多数AI基础设施工具的构建方式不同。联合创始人兼首席技术官Harshit Omar表示,该系统不是建立在像Llama这样的基础模型或标准微调大语言模型之上的。
Omar对Network World表示:"这是多个模型的混合。转换和核心能力不是大语言模型,而是我们自己的条件模型。"
标准大语言模型位于前端以解析用户意图。Terraform生成和云到云转换工作运行在基于基础设施模式训练的自定义基础模型上。训练数据完全是合成的。FluidCloud生成了自己的Terraform配置,并使用自己的转换技术来构建训练语料库。
Omar说:"我们生成了大量Terraform,并使用我们自己的技术生成越来越多的Terraform。这就是驱动大型基础设施模型的动力。"
FluidCloud使用BLEU评分对大型基础设施模型进行基准测试,这是评估生成输出准确性与参考结果对比的标准指标。Omar表示该模型目前得分为0.58。0.60的分数代表在Terraform生成任务上达到人类水平的性能。
扩展的功能和输入模型
在大型基础设施模型之前,FluidCloud的平台需要直接云扫描作为输入,覆盖大约25到30种资源类型。覆盖范围已扩展到跨云提供商的150多种资源。
输入模型也发生了变化。以前,平台需要受控扫描来产生输出。大型基础设施模型接受包含Terraform代码的现有GitHub存储库。它处理多种Terraform语法样式,包括基于模块、基于工作空间和变量配置。它还支持自定义映射覆盖。
大型基础设施模型添加了在迁移开始前运行的兼容性评分层。给定现有基础设施,它估计在目标平台上失败的工作负载百分比。大型基础设施模型还引入了故障预测。引擎分析云提供商发布周期、区域间公共网络延迟数据和计划的操作系统升级窗口。该公司计划建立一个公共社区页面来发布即将到来的故障预测,以便企业可以订阅提前通知。
该平台开箱即用包含1800个合规策略。这些策略涵盖主要超大规模云服务商,以及Vultr、OVH和Hetzner等新云提供商。
解决跨云网络挑战
跨云网络是多云迁移中较难的翻译问题之一。VPC配置、私有隧道、安全组和防火墙规则在不同提供商之间的表达方式都不同,手动迁移这些通常是迁移停滞的地方。
大型基础设施模型在云之间翻译基础设施时复制完整的网络堆栈。Omar说:"我们在另一个云中也复制整个网络堆栈,所以你真的不会丢失任何东西。所有云提供商都提供相同的功能,只是计算方式不同。"
大型基础设施模型在跨提供商DevOps和基础设施模式上进行训练,因此它处理翻译而不需要工程团队从头学习每个云的网络方言。
除了迁移,大型基础设施模型还充当优化层。Omar解释说,DevOps工程师做出的每个基础设施变更都属于三个类别之一:成本、安全或性能。大型基础设施模型对这些变量建模,并根据检测到的意图对它们进行权重设置。
Omar说:"如果你给每个变量不同的权重,它就会产生新的基础设施。大型基础设施模型理解DevOps意图。它试图寻找什么,是否在降低成本,是否在提高性能,然后平衡配置。"
关于故障预测,Omar表示上游光纤提供商是云故障的最小因素。更大的驱动因素是发布周期压力。他说:"大多数时候要么是一些糟糕的发布,要么是发布周期中的某些问题。由于每个云提供商都面临提供越来越新服务的压力,再加上AI和代码生成,质量控制和故障正在变得越来越多。"
Omar表示下一个开发重点包括用于通过MCP创建自定义基础设施工作流的智能体构建器,以及抽象云提供商API的可移植SDK。有了这些SDK,切换云部署只需要更改环境变量而不是重写API调用。
Kumar说:"我们正在推出许多智能体工作流,这几乎将为用户提供超能力。"
Q&A
Q1:FluidCloud的大型基础设施模型是什么?
A:大型基础设施模型是FluidCloud开发的专门构建的AI引擎,用于在多云环境中生成、翻译和验证Terraform。它能够扫描云环境并实际将基础设施迁移到其他云提供商,实现真正的弹性。
Q2:大型基础设施模型如何解决跨云网络迁移难题?
A:大型基础设施模型在云之间翻译基础设施时会复制完整的网络堆栈,包括VPC配置、私有隧道、安全组和防火墙规则。它在跨提供商DevOps和基础设施模式上进行训练,能处理不同云提供商的网络方言翻译。
Q3:大型基础设施模型的性能表现如何?
A:FluidCloud使用BLEU评分对大型基础设施模型进行基准测试,目前得分为0.58,接近0.60的人类水平性能。该模型覆盖跨云提供商的150多种资源类型,并包含1800个合规策略。