同时观察到大模型厂商已经开始通过与B端软件服

作者:mile官网 日期:2026-01-06 浏览: 来源:mile米乐集团

  

同时观察到大模型厂商已经开始通过与B端软件服务商合作开发更多行业需求

  受益于OpenAI独家合作,估值抬升明显。24年市场低估模型进步空间,叙事转向推理侧,认为应用公司最优,Meta坐拥社交垄断生态(潜在Agent入口)和广告场景,股价为除以外PE唯一抬升的巨头-。同年云厂商由于大幅增加资本开支但供给受限,云收入传导有延迟,三大CSP估值略有所回落。25年模型差距与OpenAI明显收敛,谷歌后来居上,生态优势为市场追逐。认为Scaling Law将持续,模型厂商打开差异化应用市场,模型推理侧需求或进入放量拐点▽★,模型和算力或为最优投资方向25年四家巨头Capex同比增长50%以上,26年测算Capex将持续实现30%以上增速○☆。

  建设,或面临电力瓶颈。24年北美数据中心容量约25GW,据Grid Strategies估计,至29年的五年时间将新增80GW需求,而考虑到煤电退役◆…◇、配套变压器建设周期长等原因,电力缺口预计将成为主要矛盾。因此巨头在建设数据中心过程中,算力能耗比或成为关键考量因素。23年迎来Scaling law红利期,24年多模态、推理模型涌现,25年算法工程与Scaling Law并进。长期来看,实现AGI仍然需要模型架构突破和Scaling做到极限。展望26年:

  ① 训练阶段Transformer的计算量和内存消耗瓶颈日益凸显;② 推理时模型的记忆能力有限▷◇,且模型参数无法跟随记忆变化。海外目前已有谷歌的Titans架构、以及Mamba架构,国内则更多从成本效率优化角度出发,包括Qwen3-Next、DeepSeek V3.2都取得了明显提升●。

  ,包括从预训练到后训练以及推理场景,而强化学习则将成为未来的重点突破方向;

  25年tokens消耗更多用于大模型企业内部以及推荐系统的重构★,但26年开始预计下游应用的需求将持续增加○,AI实际上打开了软件需求的天花板,据IDC数据▽,预计2029年全球SaaS市场将达到近1万亿美元规模(对比25年5800亿美元有明显增长),但其中玩家将重新洗牌☆◁。拥有数据壁垒,主要在垂类细分场景中布局,软件定义工作流程较复杂•☆◇,或对准确度要求极高的行业,被大模型替代的风险较小☆-,比如医疗◁•、能源、会计、安全等领域。同时观察到大模型厂商已经开始通过与B端软件服务商合作开发更多行业需求▼,或与传统SaaS厂商产生直面竞争。26年推理侧需求有望爆发,一级市场方面,编程场景、Agent爆发为主要应用方向。从用户量和创业公司的收入估值水平来看◁★,当前规模增长较快的行业以AI编程、AI Agent•、AI内容创作为主,聚焦生产力提升▽。今年以来诞生了多个爆款应用☆▷,其中AI编程软件Cursor ARR已达到10亿美元,AI agent Manus则在8个月时间ARR达到1亿美元,AI Perplexity也在向Agent拓宽产品边界,其ARR也已达到2亿美元,因此明年办公场景有望迎来更多产品落地。此外,随着模型能力的成熟◆,明年在端侧的AI手机

  、AI眼镜▪◇•,以及协助大模型在企业落地的分销商这些领域将看到明显的增长。(来源△:国信证券20260105《人工智能

  (1)在2023年及以前,LLM的发展遵循=▷“Scaling Laws”-•■,2023年4月GPT 4的成功进一步印证了该路径。(2)效率追求:传统Transformer架构的注意力机制存在二次方的计算复杂度,极大地限制了上下文长度的扩展和模型的实际部署•●□,从而催生了对稀疏架构和新型注意力机制的迫切需求■◆,如MoE架构、MLA注意力机制等。(3)推理追求:单纯的规模扩张并不能赋予模型多步骤的逻辑推理能力,直接体现为模型无法很好的解决复杂任务,从而催生了思考模型的诞生,如CoT◇。

  (4)智能体的诞生▼◁□:模型基础能力的提升+效率的提升+推理能力的增强,为智能体的诞生奠定了坚实的基础◁◇,智能体在传统大模型的基础上,进一步引入了与外部工具和环境的交互。