Gemini 3系列原生多模态能力和超长上下文窗口

作者:mile官网 日期:2025-12-22 浏览: 来源:mile米乐集团

  

Gemini 3系列原生多模态能力和超长上下文窗口

  在大模型之前的叙事逻辑中●★,规模效应驱动行业集中度持续提升,强者愈强的趋势不断强化,谷歌、阿里云◇▲、和AWS、微软的距离只会越拉越大。

  但是△,大模型让这一切有了可能,云厂商的生意发生了本质变化。有意思的是,对于如何做AI云•,即便是顶级云厂商,也没有很快达成共识。

  AI云的热闹最早是微软云的。凭借对早期OpenAI的投资,微软拥有GPT大模型的优先使用权,故事很美好▽•▲,微软希望通过GPT大模型先带飞Azure,再融入Office、Teams等应用中。

  问题恰恰出在这里,OpenAI不甘于做微软的附庸△,不仅多方寻找云资源的替代方案•▽▪,与AWS、甲骨文等合纵连横,还推出了和微软有竞争关系的浏览器等产品☆-◁。微软也不得不投资Anthropic、加大自研模型力度来应对,双方的合作从最初的美好变为●△“貌合神离”。

  微软云的声势一度超过AWS●,这也不禁让“老大哥”有危机感,于是亚马逊选择大手笔投资OpenAI的竞争对手Anthropic(先于微软),以获得领先的模型能力▲★▲。

  与此同时,亚马逊云科技的策略是◆★△“Choice Matters=▪▲”(选择大于一切),他们认为,行业内不存在一个在所有场景中性能、性价比都为最优的通用模型●◁=,因此亚马逊云科技在Bedrock上提供了多种模型选择•-。

  某种程度上,亚马逊云科技的思路并没有错,但是有一个关键问题,头部模型依然有无可替代的重要性,而大部分顶级模型要么在竞争对手的掌控中,要么企业倾向于自己提供模型服务,并不完全愿意托管在Bedrock上,这就影响了亚马逊云科技在模型层的竞争力。

  亚马逊云科技也意识到了这一点,在最近的re:invent大会上,亚马逊云科技继续新增了十多款模型选择,中国模型方面○○,在此前Deepseek、Qwen的基础上增加了Kimi和Minimax▲。同时亚马逊云科技更新了自研的多款Nova模型,至少在模型层面希望不落后太多。

  阿里云的思路更显不同,凭借Qwen模型在全球技术圈闯出了影响力。不仅是国内最早开源自研大模型的●◇“大厂■☆”,也是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商,业界率先实现◇“全尺寸•◁、全模态•★…”的全面开源,其他三家头部云厂商都没有将自己的模型规模开源■。

  在业界看来◁▪,阿里云作为市场份额更少的一方,全方面开源是一个颇有魄力的选择◆◆★,闭源模型可以保证自己的核心竞争力,开源很大程度上会削弱模型竞争力,如果可以追赶上头部云厂商★,牺牲短期利益去博得更多的用户群体,那就值得△•☆。

  通义千问Qwen衍生模型数量已突破18万,远超Meta llama系列模型;通义千问Qwen在全球下载量超7亿◁,据彭博统计,截至2025年10月,千问Qwen下载量也已超越Llama模型◁▪◆,通义成为全球第一AI开源模型。

  阿里云的目标是让Qwen模型成为产业的默认依赖■☆•,就像linux之于服务器,MySQL/HAdoop之于数据,Kubernetes之于云原生,开源为了成为标准○■◁。

  谷歌云是低开高走的典型代表,Gemini 3系列模型和第七代TPU Ironwood,被视作谷歌AI逆袭的标志。最近谷歌创始人谢尔盖·布林坦诚表示=☆,尽管谷歌早在八年前就发布了Transformer论文,但公司内部却并未给予足够的战略重视,当时在算力扩展上的投入过于保守,担心聊天机器人可能会输出错误信息或不当言论。

  谢尔盖·布林的回归打破了谷歌的大公司病,更重要的是☆●,将谷歌全栈AI的优势盘活了。第七代TPU Ironwood在性能、能效比和互联带宽上,均显示出对GPU的显著优势,Gemini 3系列原生多模态能力和超长上下文窗口,将行业标准提升到了一个新的量级,从基础架构层面就多模态的统一理解和生成,模型效果惊艳。

  这也让行业清晰地认识到,模型+云+芯片的垂直整合,是更深厚的护城河,这种全栈能力为厂商提供了可观的模型迭代效果□,也成为AI云的参考标准•。

  11月中旬,市场研究机构Gartner发布4篇GenAI(生成式AI)技术创新指南系列报告,公布了GenAI云基础设施、GenAI工程●◇▽、GenAI模型以及AI知识管理应用四大维度的新兴市场象限(Emerging Market Quadrant)。

  某种程度上可以视为AI技术栈的参考指南,AI云基本涵盖在其中●,按照自下而上的技术栈,最新的系列报告分为四个维度。

  GenAI云基础设施☆○,指的是专注于为模型训练、推理和服务交付提供优化基础设施的云服务提供商。在这一领域中,Gartner 识别了主要的超大规模云厂商,以及专注于 AI 优化基础设施的专业云厂商=•…。

  新兴领导者象限仅有微软、谷歌、AWS和阿里云四家厂商入围,阿里云是唯一入围的亚太厂商,IBM、Oracle、华为云和腾讯云位于远见者象限,Nebius●■◆、OVHcloud、CoreWeave等位于专业厂商象限,他们的优势还局限在单点能力级别。

  “GenAI模型”维度•△★,报告关注厂商所提供的GenAI模型的综合能力,包括模型的丰富度,能否覆盖不同输入输出模态、兼容第三方工具,以及安全和隐私等▷□▼。大模型需要大量的数据•▽▼、算力和工程资源,该市场高度集中,主要由少数几家厂商主导。

  四家云厂商依旧位居领导者象限★▷■,阿里云在“feature(特征)”指标上还领先于AWS、微软△,仅次于谷歌和OpenAI。此外,IBM、Anthropic、Writer、Cohere和Uipath也位于领导者象限。Meta和Mistral AI则位于挑战者象限。

  在◁“GenAI工程”维度●□,报告关注数据准备▲、模型训练/精调、模型管理☆△▷、评估●●●、观测等模型全生命周期工具。

  过去两年中,无论是既有厂商还是新进入者,都在加速推出各类工具和服务=,以支持生成式 AI 的完整工程化流水线▪,不再局限于对生成式 AI 模型进行简单的提示(prompt)调用◇☆。

  GenAI工程收录的厂商数量更多-●☆,不是所有厂商都能做云基础设施和大模型,但是工程化能力是使用模型的必备,不少厂商都将资源投入到这一层级。

  其中-,四家云厂商继续领跑◇,但是和其他厂商的差距并没有拉开◁▲,阿里云在纵轴◁◇△“特征★…”以及横轴“未来潜力★☆★”指标上,优于AWS、谷歌、微软,也让人略感意外。

  在“AI知识管理应用/通用生产力……•”维度◆,报告的评测范围覆盖企业级 AI 搜索、对话式 AI 平台◁,以及用于沟通和内容开发的生产力工具。除了四家云厂商外,Salesforce、Uipath等软件厂商也位列其中•▷。

  可以看出▽,Gartner自下而上列出了一套技术栈,而且是“真正把 AI 用起来◁”的完整技术栈★■,逐层抽象◆■、逐层贴近业务价值。AI的竞争,早已从单点的竞争转向跨四个层级的系统能力竞争□△。任何只占据其中一层的厂商,都很难长期掌握产业主导权。

  这也是为何,AI云厂商被视为大模型未来的主导型厂商,有趣的是,不同领域的头部厂商也在补充自己的全栈版图,譬如云厂商在做模型,模型厂商在补基础设施,应用厂商在下沉,所有人都在讲 Agent。

  以往,云厂商的生意是“卖云”•▲▽,更准确地说,计算◇□、存储和网络的IaaS三大件,数据库▪、数据分析平台、中间件的PaaS能力等,云的核心价值是规模化供给资源,提高IT基础设施的利用率,降低企业自建的门槛和成本。

  行业的共识是◇☆•,在AI云的语境下,企业购买的最终商品是AI,而不是原来的•“云▽○▷”,云成为AI的交付系统,云计算的底层依然存在-,但它们已经退居为支撑AI的基础设施,未来会逐渐消失在客户的账单上,就像现在企业客户无需为数据中心直接付费。

  海外市场新的云厂商也试图分一杯羹,譬如CoreWeave和Nebius等•…,各自从自己的优势能力入手☆△,有的能更快拿到英伟达的最新GPU…•-,提供裸机GPU服务,有的做起AI推理服务,然而,这些厂商很难冲击原有的四强格局。

  过去的企业需要租赁机房•■,现在的企业需要在云上开通计算实例,未来的企业可能只需要调用模型●=▪,云厂商过去二十年的变化,就是不断在自己的技术栈上叠加新的能力,这本身就是护城河。

  云厂商所做的一切基础设施建设、PaaS 能力扩展◁、平台整合,最终都指向同一个目标,更高效且更规模化地生产和交付智能。如此,结合当下的产业环境来看,AI云的核心竞争力就在于模型+云平台+芯片的垂直整合。

  当AI成为一种算力◁◇●、数据◇、软件栈高度耦合的系统工程■,模型决定智能上限,云平台把模型变成可规模化的商品,芯片决定成本下限和性能天花板△▲▪。

  目前而言,谷歌云和阿里云是更受资本市场认可的AI云逻辑,在于它们在模型、云平台与芯片等多个层级形成了正向叠加效应。这种全栈能力▲,使得模型迭代能够直接反馈到底层基础设施,也让基础设施的投入更快转化为可感知的产品优势。

  谷歌TPU已经证明性能和成本的优势,阿里云PPU虽未公开发布,但阿里云的体量显然支撑得起AI芯片的支出,并且具备自用和对外输出的想象空间。

  AWS和微软缺少自研模型,两者已经明显加速了模型自研节奏,两大巨头并非失去竞争力,而是正处在一次关键的自我修正期,如何在保持平台中立与生态开放的同时,补齐模型层的确定性;如何在外部模型合作之外•▼▪,建立真正属于自己的第一梯队能力△☆▼,决定了它们 AI 云叙事是否能够闭环。

  回看这一轮 AI 云竞赛,很难再用谁起步更早▪▼、谁体量更大来简单判断胜负。大模型让云厂商第一次站在了同一条新的起跑线上△,也第一次暴露出不同技术路径的结构性差异…。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问▪。