多组分分析方法综述

重金属多组分分析的研究现状

近年来,随着科技的进步,单组分重金属的检测技术已经非常成熟,但是在实际污染体系中重金属离子种类繁多,且它们之间往往存在相互干扰,传统的化学分析方法和化学分析仪器难以一次性精确的检测出各个重金属离子的浓度,需要对共存组分进行同时测定。

对共存组分进行同时测定,传统的化学分析方法是首先通过加入各种掩蔽剂进行组分的预分离,然后采用单组分重金属检测技术进行分析检测。这种方法的分离过程往往冗长繁琐,实验条件苛刻,费时费力,而且检测精度低,无法应用于污染现场的检测。

随着计算机科学技术、光谱学和化学信息学的发展,复杂体系的多组分分析已成为当今光谱技术的研究热点,应用范围涉及环境监测、石油化工、高分子化工、食品工业和制药工业等领域,而且需求日益显著。由于多重金属离子共存时会产生重金属离子间的相互作用,因此在用化学分析仪器检测时会产生相干数据干扰,对实验结果产生影响,为了使测试结果更加准确,需要在实验的基础上建立数学模型,用于数据处理,消除各重金属离子共存时产生的相干数据干扰。近年来,引入化学计量学手段,用“数学分离”部分代替复杂的“化学分离”,从而达到重金属离子的快速、简便分析测定[1]。

化学计量学是一门通过统计学或数学方法将对化学体系的测量值与体系的状态之间建立联系的学科,它应用数学、统计学和其他方法和手段(包括计算机)选择最优试验设计和测量方法,并通过对测量数据的处理和解析,最大限度地获取有关物质系统的成分、结构及其他相关信息。目前,已有许多化学计量学方法从不同程度和不同方面解决了分析化学中多组分同时测定的问题,如偏最小二乘法(PLS)、主成分回归法(PCR)、Kalman滤波法、多元线性回归(MLR)等,这些方法减少了分离的麻烦,并使试验更加科学合理。

(1) 光谱预处理技术

这些方法用来降噪、消除无关信息。

①主成分分析法

在处理多元样本数据时,假设总体为X=(x1,x1,x3…xn),其中每个xi (i=1,2,3,…n)为要考察的数量指标,在实践中常常遇到的情况是这n个指标之间存在着相关关系。如果能从这n个指标中构造出k个互不相关的所谓综合指标(k

这些综合指标为主成分。这一处理过程则称为主成分分析。我们要区分主成分分析和下文中所述的主成分回归的区别,这里所说的主成分分析是数理统计中常用的一种技巧,用于光谱的前期预处理。主成分回归则在主成分分析的基础上进行拟合。此方法尤其多的应用于BP神经网络中[2]。

②傅里叶变换(FT)

傅里叶变换(FT)是一种十分重要的信号处理技术,它能够实现频域函数与时域函数之问的转换,其实质是把原光谱分解成许多不同频率的正弦波的叠加和。根据需要可通过FT对原始光谱数据进行平滑、插值、滤波、拟合及提高分辨率等运算,或用FT频率谱即权系数(傅里叶系数)直接参与模型的建立。在NIR光谱分析中,傅立叶变换可用来对光谱进行平滑去噪、数据压缩以及信息的提取[3]。

③小波变换(WT)

近年来,小波变换在信号和图像处理中的应用逐渐广泛和成熟起来。与FT 相比,WT具有时频局部化特性,能够将化学信号根据频率的不同,分解成多种尺度成分,并对大小不同的尺度成分采取相应粗细的取样步长,从而能够聚焦于信号中的任何部分。高频信息留在较低的尺度上,低频信息留在较高的尺度上。这样,若设定一定的阈值,除去小于阈值的高频信息则达到去噪的作用[4]。

④净分析信号算法

净分析信号也是有浓度阵参与的一种预处理算法,最早由Lorber提出。它的基本思想与OSC基本相同,都是通过正交投影除去光谱阵中与待测组分无关的信息[5]。

⑤模糊聚类法

模糊聚类法是一种基于模糊逻辑理论的用来探寻数据潜在结构的无监督聚类方法。聚类分析可以定量地确定研究对象之间的亲疏关系,达到对其合理分类的目的。模糊聚类法已成功应用于多个领域,比如图像分析、人脸识别及转录组学等。

申明金将模糊聚类分析与RBF神经网络法相结合,对模拟原油中吸收光谱严重重叠的重金属多组分体系进行解析,较好地解决了光度分析计算中校准模型的优化问题,提高了分析结果的准确度。

(2)波长选择方法

①相关系数法

相关系数法是将校正集光谱阵中的每个波长对应的吸光度向量X。与浓度阵

中的待测组分浓度向量Y进行相关性计算,得到波长一相关系数图。对应相关系数越大的波长其信息应越多,因此,可结合已知的化学知识给定一阈值,选取相关系数大于该阈值的波长参与模型建立。

②逐步回归分析法[6]

逐步回归法的基本思想是,逐个选入对输出结果有显著影响的变量,每选人一个新变量后,对选人的各变量逐个进行显著性检验,并剔除不显著变量。如此反复选入、检验、剔除,:直至无法剔除且无法选人为止。

(3)非线性校正模型技术

①人工神经网络

人工神经网络是模拟人脑细胞的工作原理建立模型进行分类和预测的一种化学计量学方法,具有并行分布处理、自组织、自适应、自学习等优良性质,且具有非线性映射功能,能处理高度非线性问题,将一定量的神经元以网络的形式连接成一定的拓扑结构,可以有效地解决化学多组分体系同时测定的难题。

人工神经网络法在分析化学中的应用日益受到分析工作者的重视,是多元校正和分辨的较好方法之一,尤其是人工神经网络与分光光度法结合,由于无须分离,所用的仪器简单,操作方便,因而广泛应用于多组分的同时测定。对于此种方法,尤其要注意5中所述的后续处理方法。

管棣,谢青兰等人采用神经网络和分光光度法,建立了不经分离而能同时测定Cd与Co,Cr与Fe含量的方法,并用此方法测定了合成样品,得到Cd,Co,Cr和Fe的回收率分别为10l%,98%,102%和98%,平均相对误差分别为1.61%,-0.23%,0.00%和-0.08%[7]。

②卡尔曼滤波法

卡尔曼滤波法是一种递归滤波方法,Poulisse将卡尔曼滤波法用多组分析以后,其就在混合体系光谱分析中得到广泛应用[错误!未定义书签。]。其基本思想:根据测量获得的新数据对前面利用旧的测量数据所得的估计值不断地进行修正,进而预测新的估计值,直到最佳的估计值为止。该方法的特点:在已知吸光度误差方差的前提下,具有较好的分析效果,具有边测量边分析的优点。

近年来,利用卡尔曼滤波理论与分光光度法结合,实现吸收光谱相互重叠的各组分含量同时测定的报道很多。

秦侠,沈兰荪等发现,在ICP-AES中,卡尔曼滤波法是一种有效的光谱干扰校正方法,并将小波变换引入卡尔曼滤波法,使得卡尔曼滤波法的分析准确度

得到了提升[8]。

③偏最小二乘法

偏最小二乘法(PartialLeastSquares,简称PLS)提供了一种多因变量对多自变量的回归建模方法。可以有效地解决变量之间的多重相关性问题,能够对数据信息进行分解和筛选,同时能够剔除多重相关信息和无解释意义信息的干扰,用偏最小二乘法进行建模,其分析结论具有较强的可靠性和整体性。在多组分的同时测定中表现出显著的优越性。

偏最小二乘法提供了一种多因变量对多自变量的回归建模方法。可以有效地解决变量之间的多重相关性问题,能够对数据信息进行分解和筛选,同时能够剔除多重相关信息和无解释意义信息的干扰,用偏最小二乘法进行建模,其分析结论具有较强的可靠性和整体性,在多组分的同时测定中表现出显著的优越性,但偏最小二乘法属于代数法,计算工作量大,当数据量较大时,处理起来就比较困难了。

白玲,倪永年研究了采用偏最小二乘分光光度法同时测定合成试样及饲料中痕量铁、锰、铜、锌、钴和镍的方法,结果表明,偏最小二乘法是化学计量学中一种可适用于基体较复杂的实际试样中痕量组分分光光度同时测定的多元计算方法[9]。

④主成分回归法

主成分回归是建立在主成分分析基础上的多参数拟合和多组分分析方法。其首先采用主成分分析方法选取重要的因子,然后采用常规的回归方法建立数学模型,从而实现对原来数据的降维处理[12]。用主成分回归处理问题,不但可以解决原始变量间可能存在的共线问题,而且还可以收到由于分析空间的维数减少使计算效率提高和计算误差减小的效果。所以,主成分回归常用于多参数拟合和多组分分析。

白英奎,申铉国,冯毅等用红外光谱仪测量了VC 银翘片的近红外谱图然后将主成分分析法( PCAD 和线性神经网络结合分析VC 银翘片中的对乙酰氨基酚和维生素C 的含量。为了比较算法的性能作者又分别采用了偏最小二乘法、主成分分析结合BP 神经网络进行数据处理。实验及数据处理结果表明在3 种多组分分析方法中主成分分析结合线性神经网络的方法具有最高的预测精度

[10]。

⑤支持向量机

支持向量机(Support Vector Machines,SVM)是Vapnik等人根据统计学习理论提出的一种通用的学习方法,能较好地解决小样本、非线性、高维数等实际问题,是统计学习理论中最年轻、最实用的部分。其基于结构风险最小化,克服了传统学习的过学习和陷入局部最小等问题,具有良好的泛化能力,同时能够很好的解决有限数量样本的高维模型的构造问题,而且所构造的模型具有很好的预测性能。已经广泛地应用于计算科学的各个领域,如数字信号处理、图像处理、数据挖掘、人脸图像识别以及生物信息学、物理学、化学化工、药物质量控制、光谱信号处理等[11]。

近年来SVW广泛应用于光谱定量分析中,白鹏等人利用核函数将重叠的多维光谱数据进行高维空间变换后求得SVM回归模型,解决了定量分析中组分气体吸收谱线重叠的问题。在定量测量天然气的组分浓度分析实验中,组分浓度的最大误差为1.74%,支持向量机在多组分光谱重叠的分析上显示出了较强的优越性[12] 。

(4)模拟后的误差分析

①回归分析和相关性分析

对训练结果进行回归分析,分析器相关性。对神经网络来说,相关系数大于0.8时就可以认为训练效果比较好,该神经网络的结构是比较合适的。而当相关系数小于0.8时,就应该考虑神经网络的结构是否合适比如是否应该增加隐层的神经元的个数等。

②置信区间分析[13]

用神经网络进行模拟所得到的结果可信程度如何这就是模型的置信度问题。在训练过程结束后一般有一个检验样本的检验过程,可以充分利用检验样本所包含的信息对模拟结果的置信度进行预测。

参考文献

[1] 杜一平, 潘铁英, 张玉兰. 化学计量学应用[M]. 北京:化学工业出版社, 2008:7-8.

[2] 陈小前,罗世彬,王振国等. BP神经网络应用中的前后处理过程研究[J]. 系统工程理论与实践, 2002, 1:65-70.

[3] 禇小立, 袁洪福, 陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展, 2004, 16(4): 528-542.

[4] 秦侠,沈兰荪.基于小波变换的卡尔曼滤波法在ICP-AES中的应用[J].光谱学与光谱分析,2002,22(6):1009-1012.

[5] 禇小立, 袁洪福, 陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展, 2004, 16(4): 528-542.

[6] 禇小立, 袁洪福, 陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展, 2004, 16(4): 528-542.

[7] 管棣,谢青兰, 王纪明等. 用神经网络和分光光度法测定废水中的多元素[J]. 西南交通大学学报, 2007, 42(1): 129-132.

[8]秦侠, 沈兰荪, 基于小波变换的卡尔曼滤波法在ICP-AES中的应用[J]. 光谱学与光谱分析, 2002, 22(6): 1009-1012.

[9]白玲, 倪永年, 偏最小二乘分光光度法同时测定痕量铁、锰、铜、锌、钴和镍[J]. 分析实验室, 2002, 21(1): 39-42.

[10]白英奎, 申铉国, 冯毅等. 一种新的线性神经网络多组分分析法及其在VC 银翘片NIR 定量分析中的应用[J]. 光谱学与光谱分析, 2005, 25(6):898-901.

[11]Hongdong Li a ,Yizeng Liang, Qingsong Xu. Support vector machines and its applications in chemistry[J]. Chemometrics and Intelligent Laboratory Systems,2009, 95: 188–198.

[12] 白鹏, 刘君华. SVM在混合气体光谱分析中的应用[J]. 仪器仪表学报, 2006, 27(10): 1242-1249.

[13]陈小前, 罗世彬, 王振国.BP神经网络应用中的前后处理过程研究[J]. 系统工程理论与实践, 2002, 1: 65-70.

相关文档
最新文档