近年来,经济繁荣发展的背后,水质体环境问题也日益突出。对于水环境质量优劣的最好判断方法是进行水质综合评价,准确的水质等级评价是进行水体保护和合理规划利用的前体,故水质评价尤为重要。淮河是中国第三大河,是东部的主要河流之一,近年受人类活动及自然因素相互作用的双重影响而变化。建立准确的水质评价模型对水体保护与防治具有重要意义。水质评价的方法主要包括单因子指数评价法、灰色评价法、模糊综合评价法、污染指数评价法、神经网络法、因子评价法等[1]。其中BP神经网络法具有收敛速度快,高度的灵活性等特点[2]。目前,基于前人在BP算法的研究,选取研究区6个断面的水质数据,利用附加动量项的BP算法建立BP神经网络的评价模型,并对本流域的部分断面进行评价。
1 研究区概况
自2004年以来,其流域污染反弹加剧。环保部门对重点排污企业的监测结果显示,安徽淮河流域设置的19个国控监测断面有13个处于超标状态,污染物排放总量呈上升势头。其水污染原因如下:
1.部分工业企业偷排污水现象严重。经过10年来“抓大关小”,调整产业结构,但部分企业工业为了降低生产成本,追求利润的最大化,常常擅自关闭污水处理系统,偷排污水。
2.农业面源污染已经成为淮河流域的一个重要污染源。流域内农业生产中农药、化肥的大量使用。
3.城市污水的排放量逐年增加,其污染负荷已超过工业污水。
4.环境监管能力不足。淮河流域环境监测、预警、应急处理和环境执法能力薄弱,企业偷排、超标排污、超总量排污的现象不能得到有效遏制。
以上原因,导致淮河水环境中污水大量排入,特别是高锰酸钾和氨氮的大量排入,不仅造成了地表水的污染,并在一定程度上污染了地下水。
2 数据来源及方法
2.1数据采集
数据选自研究区11个数据采集点,监测时间跨度为2004年至2014年水质周报,四个常规水质监测因子,结合BP人工神经网络法,用于水质监测数据评价的模型建立,正确分析水质的各影响因素之间的相互作用,得到反映各因素特征信息精确度较高的综合水质评价结果。
2.2 BP神经网络模型
BP神经网络由输入层、隐含层和输出层[3]组成,为了建立BP神经网络模型,对研究区水质进行评价,其实质是设计BP神经网络,利用有限样本训练来表示固有的逼近权值,以减小训练误差。BP模型运行过程分为前向传播和反向传播,前项传播得出误差,反向传播修正权值,这种正反传播来调整各层权值的过程是持续重复的[4],直至无限接近于标准输出值为止。该模型以典型的三层bp神经网络结构为研究对象,以待评价指标的实测水质检测值作为输入层单元,用相应的输出值代替输出层。从而对研究区水质进行综合评价。
2.2.1 数据预处理
指标归一化:为了建立和训练水质评价的bp神经网络,对水质进行分析,必须利用四个滤波水质因子的监测数据和水质计算结果的期望值。并且样本量必须足够大,以减小网络误差,为了达到训练算法的可行性,由于各监测指标的测量单位不同,很难进行比较。直接。测量质量数据水必须在评估前标准化。
目前最常用的方式是Min-Max的方式将其实际值归一化在[0,1]之间,将样本数据分为80%的训练样本,10%的测试样本。
本次水质标准参照《地表水环境质量标准》(GB3838-2002)[5]。其标准中所研究指标只针对Ⅱ类—劣Ⅴ类的类别等级值进行建模训练。为方便BP网络运算,寻找内部规律[6],将各等级值分别取Ⅱ类-0.1、Ⅲ类-0.3、Ⅳ类-0.5、Ⅴ类-0.7、Ⅵ类-0.9。
2.2.2 BP人工神经网络结构设计
根据网络的收敛速度和水质评价样本的实际情况,选择了由输入层、隐含层和输出层组成的BP神经网络。
① 确定输入输出单元数:设计输入层包含4个神经元,即4个水质指标,输出层包含5个神经元,即每个水位代表一个输出。
② 确定隐含层的节点数。相关公式如下:
式中:N—隐含层的节点数;
m—输入节点数目;
n—输出节点数;
α—1~10的常数。
由题可知隐含层单元数为4~13
限定某一学习效率后,得到算法最小均方误差值和相关线性回归值在隐含层单元节点数为11时分别为最小和最大,其值为别为0.002和0.98。
最终确立模型结构为4-11-5。
2.2.3 相关参数确立
采用选取tanh函数作为传输函数和训练,部分参数设置如下:
动量因子:0.9
最大训练次数:25000
学习速率:0.61456
训练精度:10-2
训练得到水质评价模型,最终期望目标值与预测值在训练近5000次时的均方误差趋近于0.0033847,期望目标值与预测值拟合曲线R=0.98015,此时误差最小[7]。
3 模型应用与结果分析
由结构确定可知,随机挑选100个样本值,其模型评价准确度达90%。又随机选取12个监测点10年数据中的1000组,其中平均准确率为91.4%,说明应用BP人工神经网络方法对研究区水体进行质量评价,具有较高的可靠性。且该方法简单便捷,运算较快,减少了大量人工运算,具有较强的通用性和适用性。与单因子水质评价方法[8]相比,该方法考虑了多种水质指标的综合影响,评价结果较为客观。
4 结论
选取研究区各采集点超过3000组理化数据,建立附加动量法的BP神经网络评价淮河水质。得出结论如下。
(1)使用改进后的BP算法对4项水质指标进行分析,在误差修正时,会记录下前一次修正时的误差,即考虑了全局误差[9],避免了模型只适用于某一范围内的数据,同时避免了陷入局部最优值[10]的问题。
(2)通过试错法反复调试,BP神经网络结构为4-11-5时对函数的逼近效果最好,均方误差趋近于0.0033487,期望目标值与预测值拟合曲线R=0.98015。BP神经网络对淮河水质的历史样本的水质评价结果拟合精度较高,相对误差较小,具有良好的适用性。
(3)使用BP神经网络的水质评价模型随机评价淮河水质。结果表明,所建立的模型较适合淮河流域的水质评价。
参考文献
[1] 郭刘琴,刘文芳.我国地下水污染治理技术研究综述[J].中国矿业,2016,25(增刊2):158-162.
[2] 孟嘉伟.基于BP人工神经网络的水质评价模型[D].天津:天津大学,2010.
[3] 杜富芝,傅瓦利,杜小红,等.基于BP神经网络的三峡库区小流域水质评价[J].节水灌溉,2009(1):8-10.
[4] 陈东彦.数学建模[M].北京:科学出版社,2007.
[5] 郭晓茆,陈建江.执行GB3838-2002《地表水环境质量标准》的思考[J].环境监测管理与技术,2002(04):30-32.
[6] 杨芳,原松.基于BP神经网络的水环境质量评价模型的研建[J].人民长江,2008,39(23):46-48.
[7] 楼文高,王延政.基于BP网络的水质综合评价模型及其应用[J].环境污染治理技术与设备,2003,4(8):23-26.
[8] 夏茁文,陈宇.三种水质评价方法运用于江安河水质分析对比[J].环境与发展,2020,32(04):15-18.
[9] 马成前,王庆喜.基于局部及全局误差的BP神经网络研究[J].武汉理工大学学报,2009,31(20):99-101+116.
[10] 谢璞.“局部最优”的竞争法则[J].21世纪商业评论,2010(08):74-77.