北方伟业计量集团有限公司
基于LLE-BPNN的小麦岛海水硝酸盐含量分析
摘要水中过量的硝酸盐会造成部分水生生物难以存活、引发人类尤其是婴儿患病等危害,因此硝酸盐浓度成为水质检测中的一项重要指标。传统的硝酸盐浓度测量方法操作复杂、反应缓慢,近年许多研究人员开始通过紫外可见(UV-Vis)光谱技术结合人工神经网络(ANN)的方法对水中硝酸盐的含量进行测量。提出了一种将流形学习(manifold learning)方法中的局部线性嵌入(LLE)与反向传播神经网络(BPNN)相结合的建模方法,用以得到硝酸盐光谱曲线与浓度间的关系,实现对青岛市崂山区小麦岛海水中硝酸盐浓度快速准确的定量分析。实验选取了过滤后的小麦岛海水配置59组不同浓度的加标溶液,采用实验室自主研制的光谱分析仪采集这些样本的光谱测量值,通过标准正态变换(SNV)方法对测得硝酸盐溶液的光谱数据进行校正处理,有效降低了由仪器本身或环境带来的噪声影响;选取预处理后的光谱数据的前1 500维处理后进行对比实验,以解决使用BPNN对全部2048维数据建模时内存不足的问题,再通过网格搜索结合十折交叉验证的方法优化LLE中的邻近点数k和嵌入维数d,得到最优参数值k=15,d=3,实现对实验数据的降维处理;通过BPNN将降维后的训练集光谱信息与其对应的浓度信息进行建模,实现对预测集硝酸盐浓度定量分析,引人决定系数(R)和预测均方根误差(RMSEP)评价建模效果,与直接使用BPNN建模预测的结果比较,改进方法的R由0.926 3提升至0.9928,RMSEP由0.4425下降到0.280 4,建模预测程序的运行时间由327s缩短至0.5s。采用这59组数据的全部2048维进行LLE-BPNN建模时,得到R=0.9957,RMSEP=0.136 5,在用时相近的前提下,相比仅使用前1 500维时的建模精度更好。分析结果表明,LLE-BPNN的方法可实现对海水中硝酸盐浓度的快速预测,使预测精度得到显著提升,同时能大幅降低预测时间。
关键词硝酸盐浓度﹔紫外可见光谱技术;局部线性嵌人﹔反向传播神经网络
引言
水中过量的硝酸盐会使水生昆虫或鱼类难以存活。原因是藻类和其他植物使用硝酸盐作为肥料来源,水中过量的硝酸盐会使藻类的生长不受限制,而大量的藻类会引起水中溶解氧的剧烈波动[1]。当藻类死亡和分解时,高含量的有机物质和分解的生物体会耗尽水中可用的溶解氧,从而导致其他生物如鱼类和贝类的死亡。就像溶解氧、温度和pH 一样,水中硝酸盐的含量是由自然过程和人为干预决定的。
由于人类不得当的举动,如农业活动、人类废弃物和工业污染排放,都可能会导致水体中硝酸盐含量的升高。 近年,紫外可见(ultraviolet/ visible,Uv-Vis)光谱技术依赖回归模型及化学法标准,被广泛的用于海水中硝酸盐含量及其他参数的测量,因为测量程序简单,且可以在不产生二次污染的基础上做到快速检测[2。故本工作采用紫外可见光谱技术对从青岛市崂山区小麦岛采集到的加标海水进行测量分析,计算并预测相关样品中硝酸盐的浓度。 研究中使用反向传播神经网络( back propagation neuralnetwork,BPNN)对样本进行训练学习分析。BPNN是人工神经网络(artificial neural network,ANN)中一种被广泛应用于解决多分类及预测问题的多层前馈神经网络。ANN是一种数据驱动、自适应强、计算灵活的工具,可以高精度的捕捉到任何物理过程中的非线性的、复杂的潜在特征[3。
近些年,许多研究人员将其使用在水质评价上l4-6]。但基于ANN的方法收敛速度慢,处理数据量大时需要占用许多内存且十分耗时,甚至不能在普通的计算机上完成计算。因此,本工作使用流形学习(manifold learning)方法中的局部线性嵌人( locally linear embedding,LLE)对将要进行学习的数据进行了降维处理,不但减少了程序计算运行所需的时间和内存,并使得预测精度产生了大幅度的提高。
1原理
1.1局部线性嵌入算法 局部线性嵌入(locally linear embedding,LLE)是一种非线性降维的方法,它运用局部线性关系的组合表示全局非线性结构,从而达到对数据降维的目的[]。该方法可以在低维空间内重构数据点并保持数据之间的邻近关系,通过将高维冗余的非线性数据转化为保持原始结构的低维线性数据,有效地解决了由于数据结构发生改变而导致的模型精度下降问题。 通常,LLE可以总结为三步[8]:
下载文档到电脑,使用更方便
300 积分
通话对您免费,请放心接听
温馨提示:
1.手机直接输入,座机前请加区号 如13803766220,010-58103678
2.我们将根据您提供的电话号码,立即回电,请注意接听
3.因为您是被叫方,通话对您免费,请放心接听