時間:2021年02月26日 分類:科學(xué)技術(shù)論文 次數(shù):
摘要:化工廠中一個小故障可能導(dǎo)致大事故,從而造成生命財產(chǎn)損失和環(huán)境破壞。為了防止小故障演變成大事故,化學(xué)工業(yè)需要有效的過程監(jiān)控來及時檢測故障和診斷故障原因。傳統(tǒng)化工過程監(jiān)控方法主元分析法(PrincipalComponentAnalysis,PCA)假設(shè)數(shù)據(jù)服從高斯分布,實踐中有時并不滿足改條件。此外,其使用方差、協(xié)方差捕捉數(shù)據(jù)非線性變化時,魯棒性較差。本工作提出一種改進(jìn)的主元分析法—基于約翰遜轉(zhuǎn)換的魯棒過程監(jiān)控方法。首先引入約翰遜正態(tài)轉(zhuǎn)換(JohnsonTransformation)使過程數(shù)據(jù)服從高斯分布;其次使用魯棒性強(qiáng)的斯皮爾曼相關(guān)系數(shù)(SpearmanCorrelationCoefficient)矩陣代替?zhèn)鹘y(tǒng)主元分析法的協(xié)方差矩陣提取特征向量,構(gòu)造特征空間;最后將過程數(shù)據(jù)投影到特征空間,使用T2和SPE統(tǒng)計量實施過程監(jiān)控。將此方法應(yīng)用于TE過程故障案例,并與PCA和核主元分析法(KernelPrincipalComponentAnalysis,KPCA)對比,驗證了此方法的有效性。
關(guān)鍵詞:斯皮爾曼相關(guān)系數(shù);TE過程;約翰遜轉(zhuǎn)換;過程監(jiān)控
1前言
化學(xué)工業(yè)中的物料危險性高,且常常在高溫、高壓、易燃、易爆、強(qiáng)腐蝕的環(huán)境下運行。因此,對化工工業(yè)進(jìn)行有效的過程監(jiān)控對于確保過程安全和化工產(chǎn)品的質(zhì)量穩(wěn)定具有重要意義。過程監(jiān)控主要包括兩個環(huán)節(jié):故障檢測和故障診斷。故障檢測目的是檢測故障是否發(fā)生。故障診斷是確定發(fā)生故障的過程變量,確定故障的根原因。主要的過程監(jiān)控方法可以分為三類:基于模型的方法、基于知識的方法和數(shù)據(jù)驅(qū)動的方法[1]。
基于模型的方法根據(jù)化工過程的物理化學(xué)原理,建立精確的數(shù)學(xué)模型,利用數(shù)學(xué)模型的輸出和實際輸出的殘差進(jìn)行過程監(jiān)控。基于模型的過程監(jiān)控方法應(yīng)用于簡單過程時精確、有效,但針對復(fù)雜過程建模耗時耗力。基于知識的過程監(jiān)控方法運用專家經(jīng)驗和過程知識定性地進(jìn)行過程監(jiān)控,例如因果分析、專家系統(tǒng)和模式識別。此類方法在應(yīng)用于大型系統(tǒng)時較基于模型的方法更容易實施,但由于太過依賴專家的知識經(jīng)驗而不夠高效準(zhǔn)確。而現(xiàn)代化工設(shè)備上大量的儀表時刻產(chǎn)生新的過程數(shù)據(jù),蘊含大量過程信息。
數(shù)據(jù)驅(qū)動方法無須建立復(fù)雜的數(shù)學(xué)模型,僅依靠大量的歷史數(shù)據(jù)建模,簡便有效,已廣泛應(yīng)用于過程監(jiān)控[2-9]。數(shù)據(jù)驅(qū)動的過程監(jiān)控方法可分為基于機(jī)器學(xué)習(xí)的方法和多元統(tǒng)計分析的方法。機(jī)器學(xué)習(xí)的方法主要有 人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)[10-15]等。多元統(tǒng)計分析的方法主要有主成分分析(PrincipalComponentAnalysis,PCA)、偏最小二乘(PartialLeastSquare,PLS)、獨立成分分析(IndependentComponentAnalysis,ICA)等[16-20]。
其中主元分析法因其簡單有效的特點目前應(yīng)用最廣泛。PCA首先對數(shù)據(jù)標(biāo)準(zhǔn)化處理,然后計算數(shù)據(jù)矩陣的協(xié)方差矩陣即皮爾遜相關(guān)系數(shù)矩陣,接著對矩陣進(jìn)行對角化處理,得到一個按方差大小排列的特征值矩陣和一個與特征值對應(yīng)的特征向量矩陣。最后取前幾個對應(yīng)方差最大的特征向量即主元,將過程數(shù)據(jù)投影到主元空間,利用Hotelling-T2統(tǒng)計量(T2)和平方預(yù)測誤差統(tǒng)計量(SquaredPredictionError,SPE)得出故障檢測的閾值。
T2統(tǒng)計量代表在特征子空間里觀測值到數(shù)據(jù)中心的距離。SPE統(tǒng)計量代表數(shù)據(jù)投影到殘差空間后的模。故障診斷是通過對T2和SPE統(tǒng)計量分解,確定每個過程變量的貢獻(xiàn)度,貢獻(xiàn)度大的即為故障變量。PCA作為較早的經(jīng)典方法,應(yīng)用過程中也有一些缺點,如PCA提取的主元是一系列變量的線性組合,并沒有明確的物理意義,且隨著數(shù)據(jù)維度增加,主元系數(shù)增多,計算負(fù)荷增大。針對這些缺點,Luo等[21]略去協(xié)方差矩陣提取主元這一步,基于過程機(jī)理進(jìn)行相關(guān)分析,建立稀疏主元空間,將數(shù)據(jù)投影到此空間,再利用T2和SPE檢測和診斷故障,降低了計算負(fù)荷并提升了故障診斷的機(jī)理解釋能力。
Yu等[22]利用廣義迭代收縮法提出了稀疏PCA,大大降低了計算負(fù)荷并提升了主元的解釋性從而改善了故障診斷能力。針對PCA靜態(tài)模型不隨時間變化而導(dǎo)致適應(yīng)性差的問題,Liu等[23]提出一種自適應(yīng)的增強(qiáng)稀疏PCA。楊尚玉等[24]針對PCA使用的SPE統(tǒng)計量的保守性,用主元相關(guān)變量殘差和一般變量殘差代替SPE統(tǒng)計量。PCA有兩個缺點,相關(guān)改進(jìn)研究較少。一是PCA假設(shè)數(shù)據(jù)服從高斯分布,實際工業(yè)數(shù)據(jù)由于噪聲等污染有時并不滿足此要求。
針對此缺點,Wang等[25]和Yu等[26]提出了一種半?yún)?shù)的PCA方法,引入半?yún)?shù)的高斯轉(zhuǎn)換模型將數(shù)據(jù)轉(zhuǎn)換為高斯分布,改善了PCA處理非高斯數(shù)據(jù)的性能。張端金等[27]提出一種基于小波去噪的PCA方法,改善了PCA的性能。二是由于PCA使用的協(xié)方差即皮爾遜相關(guān)系數(shù)衡量的是嚴(yán)格的線性相關(guān)關(guān)系,捕捉非線性相關(guān)關(guān)系表現(xiàn)較差。為了解決此問題,核主元分析法(KernelPrincipalComponentAnalysis,KPCA)[28]被提出,KPCA先將過程數(shù)據(jù)投影到高維核空間,有些在低維空間中無法獲取的非線性特征在高維空間中顯示為線性,再對此高維數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)PCA處理。但KPCA需要進(jìn)行核映射,計算負(fù)擔(dān)較大。
本工作提出一種方法,能克服標(biāo)準(zhǔn)PCA方法假設(shè)數(shù)據(jù)服從高斯分布后監(jiān)控效果差、提取非線性特征缺乏魯棒性的缺點。本方法對過程數(shù)據(jù)進(jìn)行約翰遜高斯轉(zhuǎn)換,使其服從高斯分布,將標(biāo)準(zhǔn)PCA中的皮爾遜相關(guān)系數(shù)矩陣用斯皮爾曼相關(guān)系數(shù)替代。在TE過程的應(yīng)用及與PCA和KPCA的對比結(jié)果表明本方法具有更高的故障檢測率和更優(yōu)異的故障診斷性能。
2基于約翰遜轉(zhuǎn)換的魯棒監(jiān)控方法
2.1約翰遜轉(zhuǎn)換由于過程監(jiān)控方法(如PCA)的適用條件要求,化工過程中的變量都被默認(rèn)服從正態(tài)分布,但實際的效果并不總令人滿意。因此,在過程監(jiān)控之前,對過程數(shù)據(jù)進(jìn)行正態(tài)變換非常有必要。約翰遜轉(zhuǎn)換方法簡單有效,因此選擇此方法對過程數(shù)據(jù)進(jìn)行正態(tài)變換。對于非正態(tài)分布、弱正態(tài)分布和偏態(tài)分布的過程數(shù)據(jù),約翰遜轉(zhuǎn)換的實施步驟如下:(1)選取一個合適的z值。一個合適的z值對于較好地擬合非正態(tài)數(shù)據(jù)、偏態(tài)數(shù)據(jù)和弱正態(tài)數(shù)據(jù),從而獲得最優(yōu)變換,至關(guān)重要。z值的取值范圍為{0.25,0.26……1.25}。z值的選取與樣本容量n關(guān)系很大,也與不同的工業(yè)數(shù)據(jù)有關(guān),一般需多次取值試驗,尋找使數(shù)據(jù)變換為最接近高斯分布的最優(yōu)z值。
2.2斯皮爾曼等級相關(guān)系數(shù)斯皮爾曼等級相關(guān)系數(shù)和皮爾遜相關(guān)系數(shù)一樣,是反映兩個隨機(jī)變量之間變化趨勢的方向和程度。它們?nèi)≈捣秶际荹-1,1],0表示兩個變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),絕對值越大相關(guān)性越強(qiáng)。斯皮爾曼相關(guān)系數(shù)被定義成等級變量之間的皮爾遜相關(guān)系數(shù)。
3TE過程實例研究為了測試基于約翰遜轉(zhuǎn)換的魯棒過程監(jiān)控方法的有效性,將此方法應(yīng)用于TE過程,并與傳統(tǒng)的PCA和KPCA方法進(jìn)行了對比。由于此方法融合了約翰遜轉(zhuǎn)換(JohnsonTransformation)和斯皮爾曼秩相關(guān)系數(shù)(SpearmanRankingCorrelationCoefficient)的PCA改進(jìn)方法,因此將此方法稱之為JSPCA。
3.1TE過程簡介及故障檢測
TE過程是田納西伊斯曼(TennesseeEastman)化學(xué)品公司基于實際化工過程提出的一個仿真系統(tǒng)。TE過程包括五個操作單元:反應(yīng)器、冷凝器、壓縮機(jī)、分離器和汽提塔。TE過程設(shè)置了12個操作變量,41個觀測變量和21個故障。由于12 個操作變量是人為控制變量,并不會實時變化。而41個觀測變量中8個是組分分析變量,也不是實時可測的。因此本文選取33個連續(xù)可測量變量作為監(jiān)控變量。采用的數(shù)據(jù)集包含正常工況下的500組數(shù)據(jù),和21個故障狀態(tài)下的數(shù)據(jù)。每個故障都采集了960組數(shù)據(jù),前160組為正常工況數(shù)據(jù),故障從161組數(shù)據(jù)引入。
有關(guān)TE過程的詳細(xì)信息可以參考文獻(xiàn)[34]。列出了PCA,KPCA和JSPCA方法對21個故障的檢測率。數(shù)值越高越好,黑體表示最好的結(jié)果,控制限以α=0.95計算。表4列出了PCA,KPCA和JSPCA對21個故障的誤診率。數(shù)值越低越好,黑體表示最好的結(jié)果,控制限以α=0.95計算。故障10是進(jìn)料C溫度的隨機(jī)變化,會導(dǎo)致反應(yīng)器內(nèi)溫度、壓力和反應(yīng)器冷卻水出口溫度變化,即變量7,9,21。
PCA的T2貢獻(xiàn)圖顯示變量9為貢獻(xiàn)度第二大的變量,SPE貢獻(xiàn)圖顯示變量21和9分別是貢獻(xiàn)度第二大和第四大的變量,但其未能診斷出反應(yīng)器內(nèi)溫度的異常變化,即變量7。而JSPCA的SPE貢獻(xiàn)圖顯示變量7的貢獻(xiàn)度最大,其T2貢獻(xiàn)圖顯示變量21和變量9貢獻(xiàn)度分列第一和第四。因此JSPCA對故障10診斷效果比PCA要好,它診斷出變量7,9和21都對故障十貢獻(xiàn)很大。綜合比較兩種方法,JSPCA診斷出的信息更多,給出的錯誤信息也較少。這表明基于斯皮爾曼相關(guān)系數(shù)構(gòu)建的特征空間和殘差空間具有較好的解耦性能。
化工師評職知識:當(dāng)代化工研究好投稿嗎
4結(jié)論
與PCA和KPCA相比,故障檢測方面,JSPCA占據(jù)數(shù)目最多的15個最高故障檢測率,同時JSPCA使用T2檢測故障時具有最低的故障誤診率。此方法對故障5和故障10的檢測率提高最明顯,其中JSPCA使用T2對故障5檢測率比PCA和KPCA提高了約70%。同時JSPCA的T2誤診率總體上低于PCA和KPCA。JSPCA使用T2對故障10檢測率比PCA和KPCA提高了約30%。JSPCA的T2誤診率總體上低于PCA和KPCA。
這說明JSPCA魯棒性更好,能排除離群數(shù)據(jù)的影響,能排除正常數(shù)據(jù)的波動對故障變量的影響。此外,JSPCA不需要進(jìn)行計算成本大的核映射,具有簡單、高效的特點。但JSPCA使用SPE檢測故障時,誤診率太高,會造成報警泛濫。這說明斯皮爾曼相關(guān)系數(shù)提取的殘差空間丟失了大量信息。這是下一步研究的方向。
參考文獻(xiàn):
[1]LeoHC,EvanLR,RichardDB.Faultdetectionanddiagnosisin industrialsystems[M].London:Springer-verlag,2002:5-6.
[2]YangXH,RuiSH,ZhangXL,etal.FaultDiagnosisinChemicalProcessesBasedonClass-IncrementalFDAandPCA[J].IEEEAccess,2019,7:18164-18171.
[3]FezaiR,MansouriM,AbodayehK,etal.PartialkernelPCAbasedGLRTforfaultdiagnosisofnonlinearprocesses[J].JournalofIntelligentandFuzzySystems,2020,38(4):4829-4843.
[4]AhmadMR,AhmedSE.OnthedistributionoftheT2statistic,usedinstatisticalprocessmonitoring,forhigh-dimensionaldata[J].Statistics&ProbabilityLetters,2021,168:108919.
[5]CarlosO,RicardoS,BianchiF,etal.Data-drivenfaultdiagnosisandrobustcontrol:applicationtoPEMfuelcellsystems[J].InternationalJournalofRobustandNonlinearControl,2018,28(12):3713-3727.
[6]LiZC,YanXF.Performance-drivenensembleICAchemicalprocessmonitoringbasedonfault-relevantmodels[J].SoftComputing,2020,24(16):12289-12302.
[7]衷路生,夏相明.基于深度殘差網(wǎng)絡(luò)的化工過程故障診斷[J].過程工程學(xué)報,2020,20(12):1483-1490.
作者:王驥1,柳楠1,胡明剛2,田文德1*