国际先进水平!西物院在等离子体智能控制领域取得重要进展

· 技术突破

近日,核工业西南物理研究院联合浙江大学、之江实验室等单位,在磁约束核聚变等离子体智能控制领域取得重要进展。研究团队基于中国环流三号(HL-3)托卡马克的实验数据,成功开发并验证了一套具有国际先进水平的等离子体控制方法,为未来聚变堆的稳定、高效运行探索了新的技术路径。相关研究成果在国际顶级学术期刊《Nature》旗下的物理学Q1期刊《Communications Physics》上发表。

Section image

一、研究背景

托卡马克被认为是有望率先实现聚变能源应用的可控核聚变技术途径,其核心挑战在于对超高温等离子体进行长时间的精确约束和稳定控制。

传统控制方法高度依赖复杂的物理模型和第一性原理模拟器,计算耗时长,难以满足如强化学习等先进控制算法的快速、高效训练的需求。因此,构建兼具高精度与高效率的等离子体动态预测模型,对未来聚变装置如国际热核聚变实验堆(ITER)的智能化运行具有重要意义。

二、创新方法

在此次研究中,团队创新性地构建了一套完全基于中国环流三号(HL-3)历史实验数据的动理学模型,覆盖了从“等离子体状态感知”到“控制指令生成”的全链条技术体系,有助于解决数据驱动模型的累积误差问题与实现强化学习(Reinforcement Learning,RL)的高维高频长期控制难题。

Section image

该模型融合了长短期记忆网络(LSTM)、自注意力机制及计划采样等人工智能技术,有效克服了在长期预测中由模型自回归特性导致的累积误差难题,能够高保真地预测等离子体电流、位形等多个关键参数的演化。核心框架包括:

1.EFITNN——实时等离子体平衡诊断代理模型

为实现“计算精度+实时性”的平衡,团队开发了EFITNN(磁平衡重建代码 EFIT的神经网络代理模型)。性能表现方面,相比离线EFIT,相对误差<1%,在NVIDIA A100 GPU上计算耗时仅0.08ms,为1kHz闭环控制提供实时状态反馈。

2.高保真数据驱动动理学模型——攻克累积误差难题

团队以长短期记忆网络(LSTM)为骨干,整合4项核心优化技术,构建了能预测25个关键变量、6个形状参数、18路前馈线圈电流的自回归模型。该模型输入为44维向量,采用30ms时间序列窗口实现1ms步长的单步预测,在RTX4090 GPU上完成25万次迭代训练仅需22分钟,完全满足ITER的时间约束。

3.PPO-based RL控制器——高维高频控制指令生成

团队采用近端策略优化(PPO) 算法设计RL控制器,实现17路磁线圈(1个中心螺线管CS+16个极向场PF)的电压指令生成,并融合“状态-目标偏差”(采用smooth-max函数强化偏差大的参数权重)与“线圈电流过零惩罚”(避免多次过零损伤电源模块),确保控制精度与安全性平衡。

三、实验验证

研究团队将该智能体成功部署于中国环流三号的等离子体控制系统,在真实的物理实验环境中完成了等离子体电流与位形参数的闭环磁控制。

与基于第一性原理的传统建模方式相比,该数据驱动模型显著提升了强化学习智能体的训练效率——训练时间从数十小时大幅缩短至数十分钟。

实验结果还表明,该智能体不仅能精准跟踪复杂的等离子体位形目标,在面对训练中未出现过的新控制目标时,亦展现出优异的“零样本”适应能力和控制鲁棒性。

Section image

四、未来展望与应用前景

这项研究在国际上率先成功构建了一条从真实实验数据到端到端智能控制的全新路径,不仅为中国环流三号的高效运行提供了快速可靠的智能控制解决方案,也为ITER及未来商用聚变堆的常态化、自动化运行控制奠定了重要的理论与实验基础。

下一步,团队计划进行更加复杂的聚变控制实验,包括融入不稳定性预测模型、开展托卡马克装置间的迁移学习,持续提升模型整体性能,推动聚变装置从“稳定运行”向“高效运行”跨越。

参考链接:

  • https://mp.weixin.qq.com/s/vJN7zLMeVpliBVV-GZ3W7Q
  • https://www.nature.com/articles/s42005-025-02302-y