通过结合强化学习与监督微调

作者:mile官网 日期:2026-01-18 浏览: 来源:mile米乐集团

  

通过结合强化学习与监督微调

  1月15日,上海交通大学与小米集团联合发布了轻合金大模型多智能体设计平台(以下简称“平台”)。该平台以DeepLight大模型和AgentMat智能体为核心,构建起覆盖轻合金□“知识建模—智能设计—实验验证—工程应用”的全链条智能研发体系■•,标志着

  随着和材料科学深度融合,轻合金材料在航空航天、汽车-•…、消费电子等领域的应用前景越来越广阔。传统的轻合金研发模式在面临成分—工艺—性能关系强耦合、跨尺度机理复杂、研发周期长等挑战时显得力不从心。为了加速这一领域的技术突破,上海交通大学与小米集团联合推出了该平台,力图通过AI技术驱动轻合金全链条智能研发☆●△。

  上海交大材料科学与工程学院副教授饶梓元介绍□○◇,该大模型通过集成材料成分□、微观结构、相变行为等多维度知识,通过结合强化学习与监督微调,提升材料设计中的推理能力,解决了轻合金设计中外推预测难◁★、机理推理复杂等问题,提高了研发效率。基于该大模型,研究团队成功研发出超强耐蚀镁合金,其耐腐蚀性能领先▪,具备了在汽车、航空等高要求领域的工程应用潜力。

  另外,交大与小米联合发布了AgentMat多智能体协作框架▲•,针对轻合金研发生产应用流程长所带来的前沿跟进困难、落地应用时模型专家协作困难等诸多问题…-▷,该框架将材料研发拆解为知识获取、数据分析、方案生成=□、工具调用与验证、专家协作等智能体○△,结合DeepLight模型◇▽、内部积累的小模型和理论预测工具、专家判断与反馈等多维度信息,通过智能体间自动化的高效协作实现从需求分析到设计方案输出的快速闭环。AgentMat能够在1小时内完成镁合金的设计任务,并向材料科学家和工程师推送优化方案,相比传统模式▷◇○,研发效率提高了10倍以上。

  为了提供统一的评测标准,项目团队还推出了 LightAlloy-Bench,这一轻合金大模型评测基准覆盖了镁•、铝合金等多个场景,涵盖了材料基础知识掌握与性能推理能力两个维度▼。

  此次合作依托交大轻合金中心数十年的研究积累,以及小米在AI基础研究与行业应用的深厚布局,发布轻合金大模型多智能体设计平台这一重要成果。该平台构建了 “知识获取 — 设计优化 — 实验验证” 的全链条智能研发体系,将赋能镁合金、铝合金等多尺度设计研究●◇,提升小米智能汽车等业务关键部件的材料设计能力,不仅助力小米在智能汽车、领域的材料创新,还将向行业开放技术能力,推动轻合金产业发展及在航空航天等战略性新兴产业的应用,彰显了青年学者在国家级科研平台与重大交叉研究中的核心作用。

  交大轻合金中心自上世纪80年代起深耕相关领域,承担60余项重大科研项目,斩获15项国家级奖励◁▷,发表论文500余篇,跻身世界顶尖轻合金研究团队行列▪=。小米自2016年发力AI基础研究及AI+领域▼▼,在大模型、AI for Science等方向进展显著▪◁▷,凭借硬件企业的材料需求优势,落地泰坦合金等AI驱动的材料研发成果。