旨在提供清晰、系统并兼具实战参考的智能进化

作者:mile官网 日期:2025-12-22 浏览: 来源:mile米乐集团

  《云栖战略参考》第20期杂志于2025年11月发布,其基于2025年云栖大会呈现的核心主旨与前瞻洞见,完整呈现进阶ASI的生存法则与增长路径,旨在提供清晰△、系统并兼具实战参考的智能进化路线☆。

  面向未来十年,阿里云政企业务启动“双I”战略:以AI(智能化)为技术方向,以International(国际化)为市场方向,全面推动“智能化升级”与“全球化拓展□◁”的双重跃迁。

  在2025年云栖大会上■▪,阿里云政企业务首次系统对外发布了新十年发展战略,未来十年,将聚焦两大核心方向,即AI能力构建和全球化拓展☆•▼。

  当前,中国政企数字化迈入“AI原生重构”的新阶段☆。IDC数据显示◁▷▽,2024年中国政企专有云市场规模达876亿元,其中AI相关服务占比首次突破30%。与此同时○,越来越多企业选择出海,服务全球化客户成为必然○--。在这样的行业背景下,阿里云政企业务战略升级不仅是自身发展的必然选择☆,更折射出中国云计算产业从▼☆“规模扩张○••”向“质量深耕■▽◁”的转型轨迹。

  当前,自主创新走进深水区,与此同时=●◁,大模型正在引领智能创新。智算发展也呈现四大趋势△△○:第一,大模型的使用成本持续下降☆,已经具备规模化应用条件△;第二,开源模型的能力快速追赶商业模型,为模型行业化应用打下基础☆△-;第三,AI Agent加速复杂业务场景落地◇•,业务智能化场景全面开花-☆;第四,模型服务进入了后训练阶段,可用较低算力成本构建行业垂直模型☆●。

  面对这些行业发展趋势与需求△,阿里云专有云的技术底座飞天企业版正式升级为全栈智算云平台。

  本次飞天企业版的升级,阿里云专有云特别强调了“一云多算”的能力。通过“一云多芯”能力,飞天企业版全面兼容各类国产主流芯片◁☆,保障供应链安全;而通过“一云多算”能力,平台实现了对CPU▼▷◇、GPU等不同算力的统一调度,将资源利用率提升100%□。

  同时,飞天企业版还提供一站式迁移工具,可以实现VM◇、数据库◁、OS▷、Java应用等一键式迁移,通过“在线轮转”的能力◇▷-,将存量的X86负载平滑轮转到国产平台▲◁▲,真正帮客户实现“无缝演进”□☆●。

  此外,飞天企业版也在持续打磨核心关键组件的关键能力,最大限度减少客户的迁移和运维成本-•□。通过创新使用VMOC方案,在通用CPU架构上,PolarDB可支持集中式+分布式一体化能力,单库最大可支持128TB,部分性能超越传统架构;新一代Alinux4操作系统▽☆,在小文件场景里▪,实现了客户端写性能提升10倍、读性能提升1.5倍◇◇、稳定性相比CentOS宕机率下降50%。

  面向未来十年△,阿里云政企业务启动“双I”战略△•:以AI(智能化)为技术方向,以International(国际化)为市场方向☆,全面推动“智能化升级”与-“全球化拓展”的双重跃迁。

  从技术方向来看•◆,几乎所有的企业都在积极拥抱AI。AI技术快速发展,也带来了底层技术的变革,阿里巴巴集团CEO吴泳铭在云栖大会上表示:“数据中心内的计算范式正在发生革命性转变,从CPU为核心的计算○•=,正在加速转变为以GPU为核心、以大模型驱动的AI计算●▼。●”

  具体来看,阿里云专有云将从○“Cloud for AI▽”与■☆“AI for Cloud◆■▲”两大维度发力,构建真正意义上的AI原生专有云。

  在IaaS层,阿里云重点围绕客户小模型调优及后训练体系▷,单集群最大支持1.5万张GPU卡。在推理阶段,联合模型架构◆○,展开软硬协同优化▪◇□,使得百万Tokens的成本下降89%▼◁,并持续优化☆…,进入行业规模化应用的临界点。

  在PaaS层●,融合Model/MCP/Agent网关,存量接口零代码转换○◇,集成成本下降90%•…▲;兼容向量、图▷◇◆、时序、时空等10类AI数据模型,集成80+插件;配套Copilot智能开发助手,数据开发与模型训练提效30%。

  同时,作为业内首倡★▷▼“MaaS”概念的企业,阿里云也将MaaS层产品整合进飞天企业版。阿里云不仅将训推一体工具链、全生命周期Agent开发平台等整合进飞天企业版,还支持大模型服务平台▲●“百炼专属版”在专有云内直接部署,让政企客户能在安全合规的环境中开发自己的大模型。同时,平台与魔搭社区互通,支持超10万个开源模型一键同步至本地。

  在AI for Cloud方面,“云维小智”与“飞天助理■▽△”两大AI智能体全面赋能运维与运营。

  IDC发布的《中国专有云运营平台技术能力评估2025》中,阿里云是唯一在七个维度全部获得满分的厂商,这体现了飞天企业版的实力,也是“双I◇▼”战略落地的基础从市场方向来看-◁◇,全球化、出海几乎成为近几年所有具有一定规模的中国企业的必选项。

  为服务全球客户,阿里云专有云面向全球客户,正式发布三大国际化产品解决方案■:一是主权云△○-,通过可运营的“专有公共云”,支持100%本地化管控与存储,满足各国合规要求▪,支持自主训练主权大模型;二是金融云☆●•,输出中国金融级云平台最佳实践,助力全球金融机构核心系统上云=;三是V2C(VM to Cloud)方案,帮助客户从传统虚拟化平滑迁移至AI原生云平台○…,提供一站式工具链与灵活商业模式☆,显著降低IT成本。与此同时□,专有云也正式建立7×24全球在线支持体系,联合本地生态伙伴提供快速响应与长期服务能力•,确保云平台稳定运行▪▽。

  与此同时,诸多关键行业有本地化、轻量化、高性能、安全可控的人工智能基础设施的迫切需求,需要能够及时的将大模型与人工智能应用能力低成本安全快速的落地客户本地。

  在此背景下,阿里云推出了专门为政企客户设计的▷▼▽,用于加速AI应用落地的软硬一体大模型解决方案——AI Stack。

  作为阿里云打造的软硬一体AI创新基座产品▽☆,AI Stack旨在为政企用户提供大模型训推软硬一体解决方案,支持企业以轻量化、高性价比的方式进行大模型与AI应用的本地化部署,帮助用户轻松采用主流的大模型■。

  AI Stack通过深度融合芯片和推理引擎◁○•,软硬联合优化-▲,提出了一系列创新性解决方案,解决了原有资源利用率低、并行困难,以及模型量化与精度平衡等问题。

  比如在提升大模型推理效率方面,阿里云团队提出了P/D分离式推理架构FlowKV…。该框架在P/D分离架构之上,优化了KV缓存结构,减少了节点间的通信开销;并在P/D节点间实现了负载感知调度,显著提升了模型服务推理效率与系统吞吐量□◁。

  通过AI Stack可实现高性价比的轻量起步。AI Stack在开源vLLM,SGLang框架的基础上提供软硬一体优化推理框架Asllm,并整合了多种主流性能优化算子,提供极速性能。同时★◇,AI Stack单机16卡1.5TB+超大显存,是目前为止国产唯一单机支持DeepSeek无损精度671B参数模型部署的解决方案。

  此外,AI Stack内置多款主流模型,可实现秒级启动,开箱即享大模型服务,还满足了数据安全、成本效率、合规等业务要求。而且已集成钉钉、全妙•、通义灵码、百炼专属版、QuickBI等多款智能应用,助力企业实现全场景智能升级,让AI落地轻快好省◁。

  通信层面,AI Stack支持机间1.6Tbps通信带宽,低时延无拥塞通信,可面向业务进行流量调度优化及观测。

  部署层面,AI Stack支持出场预安装,可快速交付,高效完成设备上架布线、平台&模型部署、测试验证等全流程交付部署和验证测试。

  此外◁▪•,AI Stack还支持多种拓展模式•,可作为边缘站点接入飞天企业版,打造云边一体解决方案,还可以伴随业务扩容进行多机横向扩展★○-,支持多模型并发场景和训练推理一体化调度。与此同时•□▼,AI Stack还可以与多种企业级应用进行集成◇,与业务场景深度融合。

  AI技术正迈向全面的产业赋能…△▼,成为驱动国家经济和社会发展的关键力量。阿里云政企在连接技术落地和产业价值创造中不断进化■-。

  大模型时代,模型预训练时间周期长,数据规模大,对算力消耗也大,“西算”破局迎来新契机。

  建设于青海西宁的中国联通三江源绿电智算融合示范园正开创■○“源网荷储一体化”的创新模式:光伏与风电直供算力中心★,储能系统灵活调节☆●,智能电网与算力调度协同优化,实现电力“发-输-用-储●”全链路高效匹配。

  作为全球领先的绿色算力标杆项目,该园区占地近300亩,已建成5栋数据中心,部署2△.3万个标准机架★□,算力超2万P,四期建成后总算力将达15万P。依托青海丰富的风电、光伏资源◇-◁,园区通过绿色微电网实现100%绿电供应▽◁▽,PUE低至1▲■◇.2以下。

  阿里云参与智算集群设计-▷、规划与建设服务,集群核心智算服务器整机采用16张算力卡组装,算力卡兼备模型训练与推理能力,具备良好CUDA兼容性,单机可运行DeepSeek-R1-671B(BF16)大语言模型=●。

  集群整体采用阿里云飞天专有云平台构建,提供智算+通算等30余种云产品○…,集群云化率达到100%,采用成熟的超大规模组网方案,充分发挥阿里云★◆●“软硬协同优化□-▽”的最大优势,通过云计算锤炼的调度能力保障算力服务的高可用性和可靠性●◆◇。

  该项目于2025年1月由青海省政府、中国联通与阿里云共同点亮,设计规模达16000张国产AI加速卡,面向金融、医疗◇、制造◆○、政务等行业提供高效、安全□▽=、绿色的算力服务,这不仅是央企与头部科技企业深度协同的典范,更标志着中国在绿色智算基础设施领域实现关键突破,为“东数西算”工程提供了可复制、可推广的▪“青海方案”。

  目前,该项目已入选★▲○“国家绿色数据中心”、○●▲“算力电力协同典型案例”等多项国家级荣誉,真正走出了一条▷★●“清洁能源+智能计算…○”的高质量发展之路。

  当前,国家正在推进构建新型能源体系和加快建设新型电力系统,而电力系统“双高”、“双峰”的特性也越发突出☆•,电网体系亟需通过技术手段加速智化升级▲▼,以应对复杂的电力调度☆▪、负荷预测●□•、营销服务等多领域降本提效需求…★。

  在阿里云与国网的合作中,双方早在2020年就共同建设了飞天企业版云计算平台“一云多 Region”能力提供支撑的▼、覆盖全国的超大型云计算平台,更好的支撑了各种场景日益增长的智能化需求。

  2025年6月☆,双方共同构建的国家电网智能运维大模型“国网云智”也正式上线。“国网云智◇▽”是依托于光明电力大模型及国网云智能运维体系,以全链路、全方位的智能化能力支撑总部运维工作。

  “国网云智”以“专业性+可靠性+规范性”三大智能化能力为核心,实现了▪“运维知识智能问答—线上问题精准定位—检修方案智能生成”三大能力体系▽,开创性实现云平台运维效率与质量双提升。

  “运维知识智能问答▽○”以智能知识中枢破解专业壁垒◆。“国网云智”通过阿里云大模型应用工具链搭建智能问答平台,实现高效的大模型检索增强生成,使运维领域各种产品技术文档和复杂的技术原理○=▪“看得见••、学得会、用得上”★=•,实现全栈云产品知识覆盖率与召回率达80%。云平台运维人员实现知识获取效率跃升,确保技术规范动态同步,为运维决策提供即时、标准化的知识支撑☆•,也大大降低了人员培养成本。

  ■☆□“线K(“问题现象-关键报错-排查方案-处理方案•△”四位一体)诊断体系重塑处置流程▼◁☆,将异常定位效率提升40%。同时,在诊断的过程中●,还持续积累“处置案例▽△△”库■▲★,形成可复用的诊断知识资产△,为持续优化算法提供了高质量数据集。

  “检修方案智能生成•”则是以系统深度融合智能生成技术,通过自主学习国网云运维标准规范-、数万份历史运维检修方案,实现风险分析自动化□★▷、方案生成智能化。通过智能检修方案生成,让云平台标准化检修方案编写效率提升40%,切实筑牢安全生产防线■=。实现检修流程强一致性管控,规避人为疏漏风险,同时支持分钟级方案输出,有效提升应急响应能力与安全生产水平。

  …“国网云智”构建了“可观△•▲、可测、可控”的国网云智能运维新体系和新机制,为能源安全与绿色转型以及新型电力系统建设提供核心驱动力,也为“人工智能+能源▲▽=”落地创新提供了生动的实践样板▪。

  站在十年发展的新起点■,阿里云政企业务的“双I”战略不仅是自身发展的蓝图□,更代表了中国云计算产业的技术高度与全球视野。从飞天企业版的全栈AI支撑到AI Stack的轻量化突破●…,从国内央国企的深度合作到全球主权云的合规布局,阿里云政企业务正以“技术创新+生态共建▷▲”为双轮,重新定义政企云服务的标准△▽。

  在技术层面,阿里云不再将AI作为附加功能而是将其深度嵌入云平台的算力调度、安全防护、运维运营等核心环节◁,实现“AI与云的原生融合•”,这种融合能力使其在全球政企云市场中形成差异化优势。

  在商业层面,通过飞天企业版与AI Stack的产品组合,阿里云构建了覆盖大中小客户、全生命周期的服务体系,这种模式创新为行业提供了可借鉴的范本。