您当前的位置：核心期刊咨询网》理工论文》动态多流形投影算法在统计过程监测中的应用

动态多流形投影算法在统计过程监测中的应用

摘要：摘要：為了解决工业数据的序列相关性以及数据的全局和局部结构在某些异常状态下的变化问题，通过时滞偏移方法将动态行为纳入多流形投影(multi-manifold projections，MMP)模型，提出一种动态多流形投影算法(dynamic multi-manifold projections，DMMP)在统计过程监测

　　摘要：為了解决工业数据的序列相关性以及数据的全局和局部结构在某些异常状态下的变化问题，通过“时滞偏移”方法将动态行为纳入多流形投影(multi-manifold projections，MMP)模型，提出一种动态多流形投影算法(dynamic multi-manifold projections，DMMP)在统计过程监测中的应用方案。首先，在原始采样数据的基础上加入时滞变量使之具有动态特性;其次，通过分别求解全局图最大值和局部图最小值，获得全局和局部结构信息;然后，构建统一框架，即全局图最大值和局部图最小值，提取高维动态数据有意义的低维描述;最后，通过对比统计量与控制限进行故障检测，将基于DMMP的监控方案通过田纳西-伊斯曼过程验证其可行性和有效性。仿真结果表明，DMMP的整体性能优于一些传统的保持全局或局部特征的算法。新算法解决了传统算法中具有时间相关性的数据信息获取不全面的问题，为提高传统算法在动态工业过程故障检测中的性能提供了参考。

　　关键词：自动控制其他学科;统计过程监测;全局图;局部图;时滞偏移;动态多流形投影

　　随着中国向高质量方向发展的迈进，现代工业生产过程日趋精细化、复杂化，因此必须保证生产操作系统不出现任何故障。因为每个系统之间都是相互关联的，其中任何一个故障若不能及时被检测出来都可能对生产过程造成巨大威胁，影响产品质量，因此提高控制系统的稳定性、保证生产过程的安全性和可靠性变得至关重要。近年来，基于数据驱动的故障检测算法广受学术界关注，其利用集散控制系统采集的大量过程测量数据，通过压缩提取将有用的信息用于故障检测和诊断。以主成分分析(principal component analysis，PCA)、偏最小二乘法(partial least squares，PLS)和独立成分分析法(independent component analysis，ICA)为代表的多元统计学方法在过程监测领域得到了广泛应用[1-5]。

　　随着自动收集多元数据集技术的发展，对统计过程监测潜在变量的需求也随之增加。在统计过程监控中，JOLLIFFE等[6]和VANHATALO等[7]提出PCA依赖于数据在时间上独立的假设，然而生产过程收集的数据呈现出一系列的时间相关性，在当今应用中，这种假设变得越来越不现实。MONTGOMERY等[8]在研究中解释了这种现象，是因为系统动力学与高频采样相结合，从而连续观测就会连续相关。VANHATALO等[7]也证明了自相关对基于PCA的统计过程监控的负面影响。为了克服单模型、非动态的建模方式，VANHATALO等[9]针对工业过程数据呈现的动态特性，提出一种用于统计过程监控的动态主成分分析(dynamic principal component analysis，DPCA)算法。

　　田宇[10]提出一种优化动态核主元分析的故障诊断算法，该算法突破了传统算法的局限，构建一个适合处理非线性和动态数据的模型。虽然上述算法都对故障检测具有良好的檢测效果，但是在进行数据处理时只保留了样本的全局信息，忽略了局部信息对数据的影响，这就造成了局部信息的缺失。因此在学术界寻找可以保留样本邻域结构的新算法成为关注的焦点。HE等[11]为了研究数据的局部结构特征，提出邻域保持嵌入算法，有效保持了原始数据的邻域信息。HU等[12]提出局部保持投影(locality preserving projections，LPP)算法。与其他流形学习算法相比，LPP算法具有一个显著的优点，即能够容易获得一个显式的线性映射。但是，LPP算法存在一个弊端，即LPP的降维性能可能会因为丢失采样数据全局结构中存在的一些重要信息而降低。因此，全局和局部结构对于过程监控至关重要。因为全局结构定义过程数据集的外部形状，而局部结构呈现数据集的内部组织。研究人员又将目光转移到全局与局部结合的新算法来提高故障检测性能。ZHANG等[13]提出一种用于故障检测的全局-局部结构分析(global-local structure analysis，GLSA)模型，其性能优于基于PCA和LPP的监测算法。TONG等[14]基于流形学习的邻域嵌入能力，提出一种新的多流形投影算法(multi-manifold projections，MMP)。MMP的目标是找到一个最优的投影来降维表示原始数据，这个低维数据可以同时最佳地保持全局和局部结构。

　　如今的工业过程数据趋于动态性，被监测的工业过程数据变量通常是连续自相关的，依赖于数据与时间无关假设的PCA在统计过程监控中受到了限制。KU等[15]提出动态主成分分析来弥补PCA的不足，DPCA算法能够提取过程的动态变化信息，其在化工过程故障检测方面的有效性已经得到验证[16]。有学者在LPP算法的基础上提出动态局部保持投影(dynamiclocality preserving projections，DLPP)算法以提高监控性能。由于过程数据的动态特性，静态情况下的多流形投影算法已经无法满足要求，导致故障检测效果不佳。因此，如何克服数据呈现的动态特性并且最佳地保持数据的全局和局部信息成为研究的重要内容。针对工业数据表现出的时间相关性，本文提出一种动态多流形投影(dynamic multi-manifold projections，DMMP)算法，并且将其用于TE过程进行故障检测。

　　1 动态多流形投影算法

　　在过程数据朝动态特性发展的趋势下，张成等[17]提出了基于 DPCA 残差互异度的故障检测与诊断算法，有效降低了动态特征对故障检测的影响，但是忽略了样本的局部信息。DLPP算法能保持数据的局部信息，但是会丢失方差信息，从而破坏样本的外部形状。针对2种算法的局限性，本文通过引入动态多流形投影算法，使得故障检测模型对数据的动态特性有更强的捕捉性能，改善模型的过程监测性能。

　　本质上DMMP的工作方式与MMP相同。首先使用时间滞后偏移方法将包含n个原始样本的数据集X=x1，x2，…，xi…，xnT(其中xi∈Rm)转换为新的包含过程静态和动态特征的增广矩阵X，然后在X上执行MMP算法。若过程的时滞参数lag=l，通常情况下线性系统的时滞参数l为1或2，若是非线性系统，则l的数值更大，以便得到实际非线性系统的良好线性逼近。通过式(1)生成增广矩阵X：

　　X=[x1，x2，…，xi，…xn]T，(1)

　　式中：xi=xTi，xT(i-1)，…，xT(i-l)T。

　　对增广矩阵X进行标准化处理，然后利用图的邻域嵌入能力，为MMP算法构造统一的对偶优化函数，并分别定义局部图最小值和全局图最大值。

　　局部图最小值的目标函数与LPP[18]相同，先计算邻接矩阵W。局部保持函数为

　　Jp=min1n∑ni，j=1pTxi-xjWijxi-xjTp=

　　minpTXTD-WXp=

　　minpTXTLXp=

　　minpTL′p，(2)

　　其中

　　Wij=exp-‖xi-xj‖2/c， xi，xj∈Nxi，xj，0，其他，(3)

　　式中：L=D-W，在流形学习中称为拉普拉斯矩阵;L′=pTXTLX定义为局部图矩阵;D是一个对角线矩阵;对角线元素为邻接矩阵W的列(或行)之和。

　　对于全局图最大值目标函数，需要嵌入邻域信息来获得最佳外部形状的流形结构。与传统PCA模型中的平均中心不同，需要考虑每个样本xi的局部平均向量xi，可以比原始数据的平均中心向量更加独立。xi的局部均值向量为

　　xi=1ni∑xjxj∈Nxi，xj， i=1，2，…，n，(4)

　　式中：ni是Nxi，xj中的样本数，所有样本的局部平均向量为Xi=x1，x2，…，xnT。在此基础上，通过最大化下列目标函数来计算投影p。

　　Jp=max∑ni=1pTxi-xixi-xiTp=

　　maxpTX-XiTX-Xip=

　　maxpTGp，(5)

　　式中：G=X-XiTX-Xi为全局图矩阵。

　　通过上述过程将数据的局部和整体结构同时保存在DMMP中。根据图的嵌入能力，DMMP应满足2个优化标准，即全局图最大值和局部图最小值，然后通过最大化以下函数来求解满足条件的投影p。

　　JDMMP=maxpTX-XiTX-XippTXT(D-W)Xp=maxpTGppTL′p，(6)

　　将式(6)简化为广义的特征值问题：

　　Gp=λL′p。(7)

　　假设p1，p2，…，pd是对应于方程(7)的d个最大特征值λ1，λ2，…，λd的特征向量，捕获全局和局部信息的低维矩阵Y如下：

　　Y=XP(PTP)-1。(8)

　　式中：P为负载矩阵，P=p1，p2，…，pd∈Rm×(l+1)×d;Y=y1，y2，…，ynT∈Rn×d。

　　故障检测中通常用平方预测误差(squared prediction error，SPE)和T2统计量指标来分析故障检测准确性，当检测值超过控制限，则系统会将超过控制限的检测点认为是故障。SPE和T2统计量的计算如下：

　　E=X-YPT，(9)

　　SPE=EET，(10)

　　T2=XPλ-1PTXT。(11)

　　MMP是在一个无监督的方式下将邻域信息嵌入到全局和局部信息中，因此在一定程度上保留了判别特征和聚类信息。在数据分析和特征提取方面，MMP结合了全局信息最大化和局部结构保持的优点。MMP 具有非线性算法的许多特性，例如 LLE和 LE算法，并且能够揭示给定数据集的全局和局部结构。更重要的是，MMP 是一种线性降维技术，使得 MMP 在实际应用中相对容易。在传统MMP算法的基础上加入时滞矩阵，使之变为具有动态特性的DMMP算法。该算法在实际工业过程中应用更为广泛，能够弥补传统故障检测算法的不足，对动态过程数据的处理起着重要作用。

　　2 基于动态多流形投影算法的统计过程故障检测

　　动态多流形投影算法在进行故障检测时分为2个步骤，分别是离线建模和在线检测。基于动态多流形投影算法的故障检测流程图如图1所示。

　　1)离线建模过程

　　①收集正常操作下包含n个样本的历史数据集X=x1，x2，…，xi，…，xnT，其中xi∈Rm，在原始数据矩阵中加入时滞矩阵，把X转化为X=[x1，x2，…，xi，…，xn]T，其中xi∈Rm×(l+1)，使之具有动态特性，对增广矩阵进行标准化处理;

　　②选择合适的近邻数，计算邻接矩阵W，求解局部图最小值矩阵L′;

　　③计算所有样本的局部平均向量Xi，求解全局图最大值矩阵G;

　　④构造统一框架，求解投影矩阵p;

　　⑤计算DMMP模型的SPE和T2统计量;

　　⑥利用核密度估计确定2个统计量的控制限。

　　2)在线检测过程

　　①对新采集的样本数据Xnew，增加时滞矩阵使之扩展为具有动态特性的增广矩阵Xnew，利用建模过程数据的均值和方差对增广矩阵进行标准化处理;

　　②利用DMMP模型求解得到的最大化投影矩阵P计算得分矩阵Ynew和残差矩阵Enew;

　　③计算待检测样本的SPEnew和T2new统计量;

　　④将待检测样本的SPEnew和T2new与控制限进行比较，根据统计量是否超过控制限判断样本是否发生故障。

　　3 TE过程仿真结果与分析

　　3.1 TE过程

　　田纳西-伊斯曼(tennessee-eastman，TE)过程模拟器为一个实际的工业过程仿真平台，如今已经成为国际上通用的标准仿真模型[19-20]。

　　TE过程模型最先在过程控制学术界提出，并且以FORTRAN源代码的形式呈现，主要描述了工业过程中装置、物料和能量之间的非线性关系。TE过程工艺复杂，变量数目庞大，具体的工艺流程如图2所示。TE过程有21种故障，随机选取阶跃、随机和未知3种类型的故障。本文以故障5，10，18和20为例验证DMMP算法的有效性和可靠性，这4种故障的描述如表1所示。

　　3.2 TE过程仿真结果分析

　　通过TE过程仿真测试对动态多流形投影算法进行验证，并将DMMP与传统的DPCA，DLPP与 MMP算法进行比较。在测试DPCA，DLPP，MMP和DMMP算法之前，对所有高维数据都进行了降维。根据累计方差貢献率选择各种算法的潜在变量，通过SPE和T2统计量来衡量检测效果。

　　故障5为冷凝器冷却水入口温度的阶跃变化。当扰动发生时，冷凝器温度会突然升高。由于控制器的作用，扰动发生后不久冷凝器温度恢复到设定值，但冷凝器冷却水的流量异常增加，说明故障仍存在于生产过程中，需要进行故障检测。DPCA，DLPP，MMP以及DMMP 4种算法对故障5的检测结果如图3 所示。

　　推荐阅读：工业设计创意展示中的版式设计原则研究

转载请注明来自：http://www.qikan2017.com/lunwen/lig/22772.html

上一篇：碳排放权交易立法的现实困境与推进策略
下一篇：某河道防洪治理中基础处理措施研究