1 引言
核反应堆设计研究是我国占领全球技术制高点、升级现有核能装置的重要前沿技术领域。堆芯核设计从根本上由堆芯的装载方案决定,所以提高核电厂的经济性、运行灵活性和安全性,关键便在于进行堆芯装载方案优化设计。然而堆芯装载方案优化设计涉及大规模变量,包括燃料组件类型、堆芯内旧组件布置等高维大规模排列组合变量的设计。同时需要考虑的技术指标则涉及循环长度、堆芯功率峰因子、反应性系数、停堆裕量、最大燃耗等众多安全性、经济性、灵活性指标。因此,堆芯装载方案优化是一个典型的大规模多目标的组合优化问题。
国际国内从上世纪六十年代就已经开始研究堆芯装载优化方法,它一直是反应堆工程研究中的一个活跃分支。在研究早期,堆芯装载优化主要考虑简化模型,如线性规划法、非线性规划法、动态规划法、哈林原理脱偶解法等,限于计算能力限制,这些方法的模型往往采用了过多的近似导致优化获得的最优解与真实最优解偏差较大,并且由于优化过程复杂,计算量随着问题规模的增长呈指数变化,导致优化效率过低,不适用于多变量、多目标、多约束的装载方案优化问题。
在优化算法设计中,如何获得子代方案并对子代进行选择与排序是其中的关键内容,传统方法往往通过模拟生物演化规律和竞争规则得到的,并未提取相应优化问题本身的特征属性,这对于换料装载优化这一类典型的多极值、非线性强烈的问题就显得尤为重要,使得传统的进化优化算法性能在如此强烈的非线性问题上表现不佳,因此建立适用于堆芯装载方案设计特征提取方法,获得优化设计过程中方案生成方法、优化手段选择方法以及优化结果处理方法均具有广泛的参考意义。
本文广泛调研国内外特征提起方法相关研究现状,分析各技术路线对当前关于堆芯装载方案的适用性,结合堆芯装载方案设计工程需要给出适用于堆芯装载方案设计的特征提取方法技术路线。
2 特征提取方法应用阐述
对于诸如换料堆芯装载方案这一类大规模组合优化问题,如何有效提取优化空间的特征规律,以空间的特征信息指导新的优化设计,可有效提升算法的寻优能力。通过提取优化空间的特征信息,可在算法的子代生成方式、优化方向选择等多个方面形成有效指导。目前主流的特征提取方法包括数学变换方法、神经网络以及统计学习等。
2.1 基于数学变换的特征提取方法
基于数学变换的特征提取方法广泛应用于图像及信号特征提取及模式识别领域,通过将图像或信号进行各种域变换处理后再进行特征提取,如傅里叶变换[73]、小波变换[74]、希尔伯-黄变换[75]、双谱变换[76]等方法。核心思想是通过各种数学变换方法将图像或信号在域变换后放大个体之间的差异性,从而可以采用基础的特征集进行统计分析,例如信号的瞬时幅度、瞬时相位、瞬时频率等等标志性特征。而对于换料堆芯装载优化等组合优化问题,其输入为一个个离散的数据排列,目前还未见针对从组合序列到组合序列的可用变化方法实现个体差异性的放大。
2.2 基于卷积神经网络的特征提取方法
近年来,基于深度学习方法的特征提取方法在图形分析与识别、语音分析与识别等方面得到了广泛的应用。深度学习技术尝试提出一种能够模拟人类大脑神经非线性处理功能的模型,从而在处理图像等复杂信号时能够得到其抽象的表达特征。以图形信号为例,人脑的视觉系统对其处理方式为:首先针对输入图像提取其简单性质或是边缘等特征,之后将提取的特征组合,逐步逐层的提取出更高层的抽象层次特征[77]。
同时,深度学习技术能够降低特征提取过程的复杂程度,提升其可解释性。深度学习网络通常由多个单层非线性网络堆叠构成,因此深度学习网络的核心在于组成此网络的单层非线性网络。其中最为典型的代表便是卷积神经网络。它由多个单层卷积网络构成,下面先介绍单层卷积网络,然后说明如何基于单程网络构建卷积神经网络及其训练方法。
单层卷积神经网络主要有三个阶段构成:卷积阶段、非线性变换阶段和下采样阶段。下采样阶段又称为池化阶段,此阶段为可选阶段,在部分卷积神经网络中不存在池化阶段。单层卷积神经网络结果如图1.4所示[78]。
图1.4 单层卷积神经网络结构
卷积阶段主要从输入数据提取特定模式并基于学习的模式完成从输入数据中的特征提取工作。这种特定的模式被称为卷积核,最早是基于对猫的视觉研究过程中提出[79]。
非线性阶段将对输入数据进行非线性操作,避免线性模型存在的表达不足的问题。在此阶段中采用非线性操作处理上一阶段提取的特征。常用的非线性函数包括饱和非线性和不饱和非线性函数[80]。
在下采样阶段主要用于对输入数据进行降维,主要操作为平均池化或最大池化,即计算给定池化窗口内数据的平均值作为输出或池化窗口内数据最大值作为输出。
将多个单层卷积神经网络堆叠起来,已上一层输出作为下一层输入,最后附加全链接的分类器即可完成卷积神经网络的构建工作。其结构图如图1.5所示。
图1.5 卷积神经网络结构
2.3 基于统计学习的特征提取方法
特征统计算法(Characteristic Statistic Algorithm)是2002年由清华大学的刘志宏博士提出的一种演化算法[81],其本质也是基于机器学习理论设计的,采用统计学习手段对群体建立概率模型,基于采样产生新的个体。对于装载优化问题,刘志宏采用此算法研究了无可燃毒物情况下的优化,清华大学的石秀安博士进一步研究了有可燃毒物情况下的优化[82]。在装载优化问题中,通过简化模型,统计每个堆芯位置处的哈林功率相对值、有可燃毒物时的寿期初相对功率以及新组件的可燃毒物数量。然后根据统计结果(每个位置处的寿期初相对功率)作适当的高斯展宽并叠加,使得每个统计项目的概率密度分布曲线变平滑。而在生成子代时,通过随机生成方式,使得新产生个体的群体在各统计项目上的概率分布曲线与上一代尽量接近,从而实现进化。
虽然特征统计算法获取了方案本身的部分规律特征,但在实际应用中,检验新方案的寿期初相对功率值时,不是采用堆芯计算程序获得的精确计算结果。而是采用了呈“十”字形分布的5个相邻组件的k无穷线性拟合得到的,其在排除无效方案上具有较大优势,但对于局部的精细优化搜索效果不佳。
3 可用于装载方案设计的特征提取方法思考
在换料堆芯装载优化问题中,以功率分布优化指标为例,可行的装载方案往往非常稀少,从而在换料堆芯装载优化问题的解空间中,存在着评价函数基本相当但差异较大的多个可行解。同时,解的孤岛性非常严重,往往一个极值邻域内可行解的变化规律并不满足线性甚至阶梯性降低的规律,从解自身一个微小的变量变化便可能引起解性质的急剧变化,使得一个可行解变得不可行。
因此,在换料堆芯装载方案优化空间进行特征提取方法研究主要有两个方面的目的,一是分析获取一个个离散的局部最优解的特征,可用于生成具备典型优秀特征的方案,提升算法的初始生成能力。另一个主要目的便是在各最优极值邻域内,通过各极值方案与各邻域方案的差异对比分析,获取各种优化操作手段对于优化过程的影响,使得算法在寻优过程中能有效利用当前邻域范围内的特征,提升算法的寻优能力。
其中,基于统计学习的思想,可以将循环长度、堆芯功率分布等评价目标对于各项操作的响应,建立起优化空间中各优化手段的特征规律,具体而言,通过统计大量方案的特征规律,分析建立各种操作下的概率模型,以概率模型表征在优化空间各个局部邻域范围内的特征规律。从而在优化过程中借用已有历史经验实现对当前优化过程的有效指导。
4 结论
本文广泛调研了国内外主流的特征提取方法以及相关方法在堆芯装载方案设计中的应用情况。早期国内外的优化算法和程序往往采用线性或非线性的拟合函数实现子代的生成,对于换料堆芯装载优化问题的适用性不佳;随着启发式算法的大量应用,各种物理规律、社会现象、生物现象被应用于子代的生成,通过“优胜劣汰”思想尽可能多的保留优秀基因,但换料堆芯装载优化的非线性属性造成了优秀基因之间的杂交生成的方案较大概率仍是较差的方案,所以方案的生成方式应当更加匹配于当前优化空间的特征规律。
典型的特征提取算法通过人工方式引入特征量,学习获取数据的特征信息。一方面,特征信息可以用于数据的识别和分类,另一方面,通过特征提取方法建立起适用问题的特征规律,从而可用于设计建立高效的智能优化算法,有效利用优化问题的本质属性,加速优化过程,提升优化质量。
参考文献:
[1] Parks G T . Multiobjective Pressurized Water Reactor Reload Core Design by Nondominated Genetic Algorithm Search[J]. Nuclear Science & Engineering the Journal of the American Nuclear Society.
[2] Hongchun W. Pressurized water reactor reloading optimization using genetic algorithms[J]. Annals of Nuclear Energy, 2001, 28(13):1329-1341.
[3] 咸春宇, 左劼, 于中华. 遗传算法在压水堆核电厂低泄漏换料堆芯装载方案优化中的应用[J]. 核动力工程, 2002, 23(S1):12-16.
[4] 王端.基于自适应BP神经网络的压水堆堆芯换料关键参数的预测方法[J].原子能科学技术,2019.
[5] Mostafa Sadighi. PWR fuel management optimization using neural networks[J]. Annals of Nuclear Energy, 2002,29(1):41-51.
[6] Eduardo Fernandes Faria. Nuclear fuel loading pattern optimisation using a neural network[J]. Annals of Nuclear Energy, 2003,30(1):603-613.
[7] ErdoganA ,Geckinli M . A PWR reload optimisation code (XCore) using artificial neural networks and genetic algorithms[J]. Annals of nuclear energy, 2003, 30(1):35-53.
[8] Mcmahan H B , Moore E , Ramage D , et al. Communication-Efficient Learning of Deep Networks from Decentralized Data[J]. 2016.
[9] Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets[C]//Advances in neural information processing systems. 2014: 2672-2680.