
大模型的发展也正在从底层计算平台向云端完整生态扩展,影响着云计算的各个层级。就IaaS而言,催生了存算一体的算力架构;在PaaS方面,推动了AI PaaS的发展,帮助专业大模型快速搭建与落地;在MaaS层,提供了更灵活的模型定制与云端应用能力;而在SaaS层,大模型的引入解决了定制化、成本与服务质量等痛点,提升了业务落地的实际价值。因此,将大模型拆解成IaaS、PaaS、MaaS、SaaS的模块化组合,能够更便捷地将云端智能能力惠及中小企业。
1 AI的演进之路:从生成式AI走向通用AI
人工智能正以前所未有的速度演进,推动社会与产业的深刻变革。AI本质是让计算系统通过推理、学习、理解与创造等能力实现自主决策与执行任务。自20世纪50年代提出以来,AI经历了两代核心范式。
第一代以符号主义为主,靠人类经验驱动的知识表示与推理,强调确定性推理,但对数学建模和大规模数据的适用性有限。第二代以连接主义为基础,借助神经网络和统计学习来处理输入与输出关系,分为判别式、生成式与养成式等方向。生成式AI在近年崛起,通过对现有数据集的学习,能够创造全新的内容,广泛应用于图像与自然语言生成。伴随这股潮流,强大的大模型规模与训练数据的提升,使得从生成式AI向更具通用性、跨模态能力的通用AI迈进成为可能。
自从2018年GPT系列经历快速迭代,模型参数规模与训练数据量均呈现爆发式增长,使得模型在多样任务上的表现日益精准。未来的通用AI将不仅能够完成单向任务,还需要从多模态感知中整合文本、图像、声音等信息,通过对任务相关子集的激活来实现高效、精准的推理与迁移。
2 大模型的构建与应用:自建与协作开发的行业大模型
建设基础大模型是实现数字智能化的关键,但要覆盖不同行业的专业需求,往往需要跨行业的协作。总体路径包括自建基础大模型以及通过合作开发行业大模型两条主线。
2.1 自建基础大模型的考量
要自建基础大模型,企业需要具备强大的计算能力、海量且高质量的数据、顶尖的人才及完善的应用场景规划。尽管大型互联网公司或研究机构具备条件,在垂直行业内自建基础模型的案例并不多。国内一些大型运营商已成为为数不多的具备相关能力的主体,但整体规模仍相对有限。行业落地中,数据安全、隐私合规、成本与算力投入、以及本地化部署的要求,都会成为制约因素。金融等高度敏感领域更倾向于自建私有化的大模型,以确保数据安保、模型透明性与监管合规性,但这也带来数据共享困难、成本高企以及对硬件与软件创新能力的挑战。
2.2 合作开发行业大模型
在基础大模型的通用能力之上,行业大模型的开发通常通过两种协作模式推进,并常伴随混合策略以缓解数据不匹配等问题。
1) 中心化模式。垂直行业企业将数据提供给大模型提供方,由对方完成再训练、适配与知识蒸馏等工作,随后进行迁移到具体场景。该模式在大多数情况下由基础模型提供方主导,行业企业可能处于受限地位,后续的微调和云边端部署也需要由提供方持续支持,存在数据在流转过程中的潜在泄露风险。
2) 非中心化模式。大模型提供方将训练好的模型下发给垂直企业,企业在此基础上结合自身专有数据进行微调、指令优化等,形成行业大模型或一组专用子模型。此路径虽减少了数据外部流转的风险,但对企业自身的技术能力要求较高,且预训练与微调阶段之间的数据兼容性可能成为挑战。
为解决数据不匹配等问题,出现了混合式路径,将行业数据在预训练阶段以一定比例引入,在微调阶段再加入通用数据,借此提升表达力、理解力、迁移与泛化能力。例如,通过在训练阶段对行业数据与通用数据进行随机混合的方式来进行阶段性微调,从而缓解预训练与微调之间的差异。
3 对MaaS及其工具链的探索
行业大模型的协作开发涉及到数字孪生、工业设计、药物仿真、电力系统建模、视频生成、动漫渲染等场景。实现云、网、边的协同通常需要将行业算力网接入IPv6网络,形成统一的云端与边缘协同环境。IDC等数据中心作为算力网的核心,提供了算力资源,而PaaS与SaaS层的算法与应用负责模型的部署、管理与服务化。垂直企业可以与大模型提供方共同构建行业大模型,但中小企业的参与仍面临资源与技术门槛。因此,MaaS应运而生——它将大模型的能力以可嵌入的模块化形式提供给中小企业,便于在本地设备、私有云或公有云环境中进行定制化微调与应用落地mile米乐。
把IaaS、PaaS、MaaS和SaaS整合在一起,可以构建一种新型云智平台。通过MaaS,将基础大模型、行业模型以及第三方模型等组件串联起来,并配套数据管理、模型训练、评估优化、预测部署、提示工程与插件应用等工具链,支撑企业在大模型基础上的再开发与应用落地。工业应用往往需要对推理过程进行可解释性设计、场景迁移能力的增强以及对抗性数据的鲁棒性评估,工具链在其中发挥着关键作用。国内已出现若干以MaaS为核心的服务平台,覆盖了大模型调度、训练、微调与部署等能力,帮助企业更高效地发挥大模型的应用价值。
4 大模型推动云服务的创新
大模型的兴起对云计算的各层级均产生深远影响,推动了云服务的新格局与新能力。
4.1 大模型时代对算力网络的需求
在大模型场景中,算力网络需要具备以下能力:对应用需求的感知与差异化SLA保障、对热数据的实时计算与低延迟、零丢包以避免大规模分布式计算的效率损失、对海量小文件的快速加载与GPU资源的高效利用、对安全性与可观测性的综合支持、以及低碳、高效的资源调度与算力接入体验。
4.2 对IaaS的推动
大模型训练对带宽与存储带来的压力促使存算一体化架构成为主流趋势,能显著降低数据搬运带来的时延,提高算力利用率。通过高性能的RDMA网络、分布式存储与计算资源的协同调度,大规模集群与万级 GPU 规模在线训练已成为现实案例,推动IaaS从传统模式向新一代算力平台跃迁。
4.3 对PaaS的推动(AI PaaS)
在PaaS层,开发者需要更完善的对大模型的支持以实现快速搭建、测试与落地。AI PaaS应提供端到端的并行训练优化、场景模型的迁移能力、以及与应用系统的深度集成能力。通过MaaS对大模型的定制与编排,PaaS能够实现对专业领域模型的快速组合与应用部署,降低企业构建专业能力的门槛。
4.4 对SaaS的重新定义
大模型为SaaS带来新的服务模式与商业模式。通过对大模型的微调与定制,SaaS可以以“工厂化定制”的方式快速生成面向特定场景的算法与应用,降低过去人工定制的成本与周期,提升标准化、可扩展性与服务质量。借助自然语言交互,大模型为SaaS的界面和交互方式带来革新,推动云端应用在办公协作、CRM、ERP等领域的落地与普及。
5 大模型赋能企业数字化转型
大模型与高带宽、广覆盖、强大平台共同作用,正在推动企业数字化转型在更广泛的场景落地。在离散制造现场,5G-CPE与工业设备通过无线与有线网络连接,数据经由边缘设备与中心系统汇聚、分析与决策。核心网络的分层设计和IPv6的多归属能力使数据能够在企业内实现本地化分流与安全隔离,降低数据外泄风险并满足超低时延的需求。通过这样的云网边协同,企业能够在无需自建完整数据大脑的前提下,实现大数据分析与AI决策,从而提升生产效率与管理水平。
6 从云网协同走向算网融合
当前正处在云化与网络协同不断深化的阶段,向算网融合迈进需要克服多个技术挑战。云网协同的核心在于通过SDN/NFV实现网络与计算资源的高度协同,并通过IPv6等前瞻性网络技术实现数据中心、办公网络与边缘网络之间的无缝互联。算网融合则强调对算力的统一标识、调度与感知,结合网络资源实现端到端的高效计算与数据传输。路由、带宽、时延等因素对算力效率有直接影响,任何微小的网络性能波动都可能对大规模推理与训练造成放大效应。因此,推进云网协同与算网融合,需要在标准化、互操作性、资源治理与安全等方面持续推进创新。
7 AI加速数智化发展
当前正处于第三次工业革命的关键阶段,数字经济以数据为新生产要素,信息化正逐步转型为数智化。大模型与云网融合成为推动各行业数字化升级的核心驱动之一。以更高的算力、更强的数据整合能力、以及更灵活的云端服务为基石,企业能够在计算资源、数据治理、应用开发与场景落地等方面实现显著跃升,推动产业链的智能化升级。
8 学习与实践路径的思考
对于希望进入大模型领域的从业者,制定清晰的学习与实践路线至关重要。可以围绕以下方向开展学习与练习,尽量做到系统化、阶段化、落地化:
- 系统学习路线:了解从符号AI到连接主义、再到生成式与通用AI的发展脉络,掌握核心概念、模型结构与训练流程,以及多模态与迁移学习的基本原理。
- 技术路线实践:掌握大模型的训练、微调、推理、评估与部署全过程,熟悉Pytorch等主流框架,学习数据准备、提示工程、评测指标与鲁棒性分析。
- 场景化应用:结合具体行业需求,学习如何将行业数据接入、对模型进行定制化微调、并完成云端到边缘端的落地应用。
- 安全与合规:深入理解数据隐私、模型可解释性、风险控制与监管要求,建立合规的模型治理体系。
- 实践案例:通过行业案例学习模型在诊断、推荐、智能制造、智能客服等场景中的应用方法、瓶颈与优化策略。
结语
大模型在云计算生态中的作用日益突出,驱动IaaS、PaaS、MaaS、SaaS等多层级的协同创新。通过行业协作、混合训练策略与工具链支撑,企业能够在更低的门槛下实现行业定制与快速落地。面向未来,云网协同与算网融合将成为提升大模型落地效率与安全性的关键路径,而AI将继续推动社会经济进入以数据与智能为核心的新阶段。对于个人和企业而言,系统化的学习与持续的实践将是掌握这一变革性技术的关键。