下一代超级计算机在概念与技术层面的竞赛仍在

作者:mile官网 日期:2025-12-28 浏览: 来源:mile米乐集团

  

下一代超级计算机在概念与技术层面的竞赛仍在继续

  “以前我们的客户上云,考虑的就是数字化管理过程中◇,自己不再花时间配置服务器系统、装开发软件,或者不管数据存储和安全,厂家的云计算系统都给你部署好。现在大模型时代◁▲,云可以调度的资源△、算力更充分■-,像我们也可以更好去开发中小企业客户尤其是创业团队○,我想★-,这是AI云时代对我们做业务的人一个很大的改变。”重庆某云厂商的代理商谈到。

  这个观点其实不算意外,2025年杭州云栖大会现场▽★▲,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭的发言打破了AI云行业此前▲•“算力竞赛”的同质化叙事:“AGI只是起点,能自我迭代、全面超越人类的超级人工智能(ASI)才是终极目标•▲•。”伴随这一判断,他进一步明确两大核心定位,“大模型是下一代操作系统,超级AI云是下一代计算机-○◇”。

  当下,全球AI算力需求以两三个月翻一番的速度爆发•▲,千行百业从◆☆△“尝试AI”向“依赖AI▪”加速转型,云计算的价值正从◇“通用算力供给”转向“智能生产核心”。

  在此背景下,2026财年第二季度阿里云季度营收398.24亿元同比增长34%,其实不仅阿里云抛出了面向ASI的长期战略,华为云、字节云等玩家也纷纷从算力架构…☆=、应用落地等维度破局,一场围绕■◇“下一代超级计算机”的行业变革已悄然开启。

  只不过回过头来看,过去,关于大模型市场火热☆▽□,几乎演变成了马拉松式的长跑,在起跑阶段,投资人大多关注模型技术本身的突破,例如,算法有多先进▷■,硬件有多精密,订单有多密集。

  站在行业视角这个看法的确没错-◁。但如果眼光拉长,我们就会发现,AI时代的云服务本质是一段前半场技术、后半场落地的接力赛□■,所有产业也都是在这样不断的接力中逐渐完善的◇•。

  因为用户愿不愿意买单,体验好不好用▪-☆,能不能形成商业闭环,决定了能否再次开启下一阶段的第一公里。

  更直白来说◁○,最后的胜者大概率是最懂用户、最懂市场☆□▪、最先把玩具卖出去的那一个。

  随着AI从“实验室技术▷○”走向“产业基础设施”,AI云行业正迎来需求、政策、技术三重红利的叠加爆发期,而头部厂商的布局差异,也让这份红利的落地路径逐渐清晰。

  一方面…■,大模型训练与推理对算力的需求已迈入新的时代,中国500强企业中约70%已将生成式AI嵌入业务流程,46%的受访企业表示将生成式AI规模化的应用于业务流程改造中◁◇。

  公开资料显示,当下中国企业级大模型的日均Token消耗量在2025年上半年达到了10.2万亿,较2024年下半年激增363%。

  高盛还预测,中国云服务提供商(CSP)的资本支出在2025年第三季度将同比增长39%,为AI云收入的持续增长提供硬件基础,侧面反映客户对基础设施的需求十分旺盛。

  另一方面◁★,不同厂商的算力供给策略开始分化,例如,华为云通过CloudMatrix384超节点实现“算力池化”,将单卡推理性能提升至H20的数倍以上,未来华为CloudMatrix超节点规格将从384卡升级到8192卡,可实现50万-100万卡的超大集群,主打“高效算力供给”。字节云也依托短视频、直播场景的天然优势=▲,聚焦▲◆☆“碎片化推理需求”,为内容生成类企业提供弹性算力支持☆。

  政策与资本层面,全球范围内的“AI基建竞赛▼”已进入白热化阶段,国内“东数西算”工程持续推进,全国一体化算力网已覆盖多个枢纽节点,也为AI云基础设施的区域均衡布局提供政策支撑•▽。

  自然地,资本投入同样激进,海外微软●、谷歌、亚马逊的AI相关资本开支连续三个季度上调☆•,理论上=☆,这种“政策+资本”的双重驱动,会为AI云行业搭建了坚实的发展底座。

  单纯按照技术价值重构角度看●,AI云正从▪“基础设施”升级为“产业创新引擎▼”▼,催生万亿级市场空间。

  过去,云计算的核心价值是把服务器、存储设备、网络硬件等基础设施打包成服务,供给用户租用,不用自己买硬件,△★☆“按需供给算力”▪。核心特点是省成本◁、免维护。

  而现在AI云通过大模型调度,将智能能力输送至各行业,效率也更高了,在医疗领域,华为云协助医院搭建的AI辅助诊疗系统,可将病理切片分析时间快速缩短,又例如◁■,在传媒领域,字节的云AI内容生成平台,支持短视频脚本、画面▲●☆、配音的一站式生成,内容生产效率提升数倍。

  阿里云与上述两者有所不同,除了借助自研TPU集群的效能和全栈式架构提高客户上云部署效率■,较低成本之外,打通自身在地图◁◁◇、外卖、电商、夸克、支付宝等业务领域的能力壁垒,同样彰显其云价值。

  商业路径的创新不仅改变了产业流程,更重塑了云计算的价值逻辑●,Token成为“未来的电”,AI云则成为“智能时代的电网”。

  IDC数据显示◆•,2024年中国AI公有云服务市场规模达195○▼•.9亿元人民币,相比2023年增长55.3%,未来几年AI相关服务贡献占比将进一步实现快速提升。

  尽管红利显著▪,但大模型的快速演进也让AI云行业面临三大共性困扰,这些问题不仅制约着产业落地速度,也成为检验厂商竞争力的关键标尺▽-。

  一方面,算力供给缺口持续扩大,Coreweave等企业公开表示,当前全球AI算力基础设施产能仅能满足约60%的需求,阿里云、华为云等厂商虽持续加码硬件投入,但GPU/NPU芯片的生产周期、数据中心建设周期(通常2~3年),可不排除随着市场的需求增加,算力需求空缺仍将面临指数级增长。

  另一方面-▷▽,算力效率瓶颈同样突出▽■,传统以CPU为核心的计算范式,在大模型场景下“水土不服=”▪。

  客观地讲,大规模分布式训练中▲•,网络带宽不足会导致数据传输延迟,拖慢整体训练进度■○;推理场景中,显存不足会使多轮对话的首Token时延大幅增加▲,未优化的架构下首Token时延可达数百毫秒,严重影响用户体验▽□,中小厂商仍受限于技术积累★★,难以突破效率瓶颈,进一步加剧了行业的•…“算力鸿沟”。

  大模型从“通用-•-”向“垂直”演进时,普遍面临…○“原始数据缺失”的问题•,例如●,当前AI训练多依赖人类归纳后的二手数据◇■,如汽车设计场景中,AI无法直接获取车辆全生命周期的运行数据,只能依靠用户调研、故障报告等间接信息,限制了模型的创造力。

  部署层面☆•,◇“公共云●”与△“本地化”的对立难以调和△★,企业将数据上传至公共云,存在安全泄漏风险▽…,且传输效率低,选择本地化一体机部署,又面临建设成本高(单套设备采购+运维费用超千万元)、性能固定(无法弹性应对需求波动)、模型更新慢的问题◆□=。

  一些厂商曾为某教育企业设计混合部署方案◇■▼,但仍需在数据安全与算力弹性之间反复权衡◇◁,反映出行业的普遍困境▪○。

  当前全球科技企业虽纷纷布局AI云,但多数厂商仅聚焦单一环节,部分企业擅长模型研发(如部分AI创业公司),却缺乏基础设施支撑,只能依赖第三方算力▽◁,部分拥有算力资源(如传统IDC企业)…,却无法与模型深度协同,导致算力利用率不足一半•-。

  即便是头部厂商,也存在生态壁垒,华为云的昇腾生态仍处于培育发展期▼,要达到CUDA的开发者粘性需要时间验证•;字节云的开发者工具多聚焦内容场景,通用性尚需进一步提升▼,阿里云同样需要应对客户日渐复杂的场景适配需求。

  举一个简单例子△,宇树科技CEO王兴兴曾认为,在机器人领域尚缺一个机器人专属大模型,人形机器人量产的瓶颈也是因为AI模型不足◁▽。这就侧面证明,AI云的产业渗透速度在特定的某些领域还不够快▪。

  传统软件开发门槛高,系统自主性不强,潜在开发者仅数千万规模●,难以满足AI时代“人人用自然语言创应用”的需求,行业整体仍面临“模型-工具-应用”协同不足的问题▽=•,制约了AI云的规模化落地。

  下一代超级计算机在概念与技术层面的竞赛仍在继续,但当下的商业化产出与市场回报可以被视为影响未来格局的风向标○★▽。

  国际权威咨询机构弗若斯特沙利文发布《中国全栈AI云服务(公有云)市场报告2025H1》报告显示,2025年上半年,中国全栈AI云服务市场规模达259亿元●☆▲,其中阿里云以30=▲△.2%,市场份额位居第一,百度云、火山引擎、华为云等处于后续梯队。Omdia报告则显示◁▷,2025年第二季度,阿里云、华为云和腾讯云的市场份额分别为34%、17% 和10%。

  不同厂商所拥有的行业地位,大多与自身的投入水平力度有关,某种程度上也影响了谁能在未来成就下一代超级计算机。

  谷歌预计2025年资本支出将在910亿至930亿美元之间-▷▽。有报道称,过去十二个月内,阿里累计资本开支已超过1260亿,预计未来还可能在原定的3800亿AI投入上持续加码。

  相比之下◇,字节、华为云等未披露具体关于在AI以及云上的公开投资承诺,尽管腾讯声称“将会在AI方面投入巨额资本支出◁▪”,但目前也还在数百亿内,百度同样与阿里相比在资金投入上略显规模差距▽-▲。

  回过头来看厂商们提出的全栈自研,可以姑且将其作为筑牢技术底座的核心逻辑◁◆,也就是实现★“计算-网络-存储-模型▪○”全环节优化。

  客观而言这与当年王坚院士关注云计算的基础设施层一样•★▼,阿里云或许也觉得,打通底层是要做的第一件事,为此推出自研磐久128超节点AI服务器,单柜支持128个AI计算芯片◇▪,密度较行业平均水平提升50%▲▼,且兼容英伟达、昇腾等多种主流芯片▼●★,解决了▷“芯片适配难•”的问题。

  解决了投入与适配问题,第二件事是场景与生态打通,即谁的资本回报收入规模更高▽■▽,谁能让更多的客户使用。

  阿里云财报披露,收入在财年Q2同比增长达到34%至398.24亿元。百度的AI云今年第三季度单季度收入只有42亿元,同比增长33%,而去年全年,华为纯云计算业务的收入约为385.2亿元,同比增长仅8.5%☆。

  值得一提的是,基于●“东数西算”网络动态调度本地与云端算力,为企业提供“极简接入、柔性访问、安全流转”的用算体验★,企业只需接入云的算力网络,就能根据需求灵活选择公共云、边缘节点或本地部署。而据悉,目前中国500强企业中53%使用阿里云AI服务,实际渗透率领先行业。

  回过头来看技术细节,从AGI到ASI,AI云行业的竞争已不再是☆▽“谁的算力更强”▷…,而是“谁能构建支撑智能进化的基础设施”。

  大厂们对云的探索◆●,既展现了头部厂商的技术野心,也折射出行业的发展方向★,只有将技术突破与产业需求深度绑定,才能让超级AI云从“概念”变为“现实”◇●▼。