時間:2021年04月07日 分類:科學技術論文 次數:
摘要:高光譜圖像含有數百個波段,包含豐富的光譜信息,因此被廣泛應用于地物分類中,但仍存在著維數災難的問題。高光譜圖像中同時也含有豐富的紋理信息,有效利用紋理信息能夠顯著提高分類精度。三維Gabor濾波器不僅能夠保留圖像豐富的光譜信息,還能提取到圖像的紋理特征。為了充分利用高光譜圖像的特征,提出一種基于三維Gabor和殘差三維卷積神經網絡(Res-3DCNN)的分類方法。三維卷積神經網絡(3DCNN)能夠直接對三維立方體數據進行處理,提取到深層紋理-光譜信息,然而隨著網絡層的加深會產生網絡退化問題,因此利用殘差思想對3DCNN模型進行改進。在PaviaU、IndianPines和Salinas三個公共高光譜圖像數據集上進行實驗,分別取得99.17%、97.40%、98.56%的平均分類精度,結果表明該方法能有效提高高光譜圖像的地物分類精度。
關鍵詞:高光譜圖像分類;卷積神經網絡;三維Gabor濾波器;三維卷積;殘差學習
衛星傳感器捕獲的高光譜圖像(HyperspectralImages,HSI)[1]每個像素都含有大量光譜帶,能夠同時獲取地物的空間信息和光譜信息。與RGB圖像相比,高光譜圖像能夠更精細、更準確地識別地物信息。因此高光譜圖像在遙感應用中發揮了重要作用,如目標檢測、地物分類等,然而,高光譜圖像分類仍然面臨著維數災難[2]的問題。隨著深度學習的應用愈發廣泛,利用深度學習對高光譜圖像進行分類逐步成為目前的研究熱點。
衛星通信論文范例:基于衛星通信的應急通信系統
卷積神經網絡(ConvolutionalNeuralNetworks,CNN)[3]的網絡結構簡單,不需要人工設計參數,并且能夠提取深層特征。Chen等人[4]提出首次將空間信息加入到基于光譜信息的堆疊自編碼器(SAE)中,提出一種新的融合光譜信息和空間信息的深度學習框架。Huang等人[5]提出雙向遞歸神經網絡(Bi-RNN),用于高光譜圖像分類,考慮了波段之間的相關性,同時利用前向和后向的信息進行分類。無論是SAE還是RNN在輸入時都要將特征拉成一維的向量,以適應網絡結構,而高光譜圖像是三維結構,無法完整保留空間特征。
二維卷積神經網絡(2DCNN)[6]在三通道圖像上表現良好,但是高光譜圖像有上百個波段,2DCNN無法很好地利用這些波段信息。3D圖像的處理促進了三維卷積神經網絡(3DCNN)[7]的發展,3DCNN可以在空間維度上實施卷積操作,有效利用了圖像的空間特征,而相鄰像素一般在很小的空間里屬于同一類別的可能性很高,而且3DCNN可直接對三維數據進行特征提取,得到深層空間和光譜信息。
但隨著網絡層次的加深,網絡難以收斂,尤其是在樣本量較少的情況下,網絡結構的加深并不能有效提高分類精度,甚至會呈現梯度消失和梯度爆炸的現象。殘差學習和普通神經網絡區別在于引入捷徑連接,構造殘差模塊,殘差模塊以跳層連接的形式實現,將單元的輸入直接與單元的輸出加在一起,再使用激活函數進行組合,有效防止了網絡層數加深時產生的梯度消失或梯度爆炸問題。
并且殘差網絡容易優化、不會引入額外的參數。高光譜圖像中的紋理信息,是辨別地物類別的重要因素。Gabor濾波器[8]具有提供區分性和信息性的特性,對圖像的邊緣變化敏感,有較好的方向性和尺度選擇性。與其它濾波方法相比,Gabor濾波器在提取紋理信息方面顯示出優越性能,可以同時在方向和尺度兩個維度進行濾波,獲取紋理特征。付青等[9]提出了Log-Gabor-CNN方法,使用Log-Gabor提取其紋理特征。但Log-Gabor為二維Gabor濾波器,只能獲取其紋理特征而沒有考慮光譜信息。
三維Gabor濾波器[10]能夠在提取紋理特征的同時保留光譜信息。馮逍等[11]將三維Gabor濾波器與SVM[12]結合(Gabor-SVM)用于高光譜影像分類。而SVM分類器雖然可以通過調節輸入的信息比如空譜信息來獲得分類結果,由于是基于淺層特征的分類,精度不高。魏祥坡等[13]提出了雙通道卷積神經網絡和三維Gabor結合的地物分類方法Gabor-DC-CNN(Gabor-dual-channel-CNN),使用2DCNN提取圖像的空間信息,利用三維Gabor濾波器,對立方體數據進行濾波,輸入到一維卷積神經網絡(1DCNN)中進行深層光譜-紋理特征提取,最后將兩種特征進行融合。1DCNN的感受野較小,只能考慮每個位置單獨的信息,而且需要雙通道進行特征提取,最后進行融合,需要大量的訓練時間,效率不高。
為了充分利用高光譜圖像立方體數據的信息,本文提出了一種基于三維Gabor濾波器和殘差3DCNN的高光譜圖像分類方法。該方法可以通過三維Gabor濾波器得到包含紋理-光譜信息的立方體數據,3DCNN可以直接對處理后的立方體數據進行特征提取,充分利用數據的紋理-光譜信息。在三維卷積神經網絡中,添加了多個殘差模塊,用于更有效地提取抽象特征表示。同時,通過殘差模塊,解決隨網絡深度增加導致的梯度彌散和梯度爆炸問題,提升網絡性能,有效提高了高光譜圖像中的地物信息的分類精度。
1本文方法
本文方法針對高光譜三維立方體數據,首先使用三維Gabor濾波器,得到包含紋理-光譜信息的三維立方體數據;然后輸入到殘差三維卷積神經網絡中進行特征提取,最后進行地物分類。
1.1三維Gabor濾波器
由于高光譜圖像三維數據的特殊性,二維Gabor濾波器只能獲取紋理特征沒有考慮光譜特征。三維Gabor能夠在頻域和空間域找到最好的組合定位,在提取紋理信息的基礎上,考慮了圖像的光譜特征。對于紋理信息和光譜信息擁有較好的識別能力。
網絡結構中共包含3個殘差模塊,其中1個虛線范圍表示使用一個殘差模塊,包括2個5×5×5的三維卷積核和一個特征融合模塊。本文設計的殘差模塊,放在卷積層之后,將上一層卷積得到的特征,與殘差模塊內經過2層卷積得到的特征進行特征融合,經過ReLU激活函數后,繼續輸入到下一個池化層。
這使得該殘差模塊在輸入特征基礎上學習到新的特征,從而擁有更好的特征表示。為了讓激活函數更有效地使用輸入信息,在每次ReLU之前采用批量歸一化BN(BatchNormalization),為了防止實驗結果過擬合,采用Dropout正則化[16]方式,隨機刪除部分隱藏層結果。之后,將獲得的結果輸入全連接層。最后,使用Softmax激活函數,進行分類操作,得到其類別標簽。
2實驗與分析
實驗時的硬件運行環境是AMDRyzen53600XCPU@3.80GHz處理器,RadeonRX5500XT@8GBGDDR6顯卡,金士頓駭客3200MHz@8gDDR4內存,編譯環境Python3.6+Tensorflow1.13。2.1實驗數據為了證實所提方法的有效性,本文使用目前公開且具有代表性的PaviaU、IndianPines和Salinas數據集進行實驗。
2.2參數設置
訓練網絡時參數設置如下:方差為0.1、均值為0、Dropout為0.5、偏置為0.1的截斷正態分布,初始學習率為0.001。從訓練時間和測試時間的結果可以看出,本文方法比Gabor-DC-CNN方法消耗的時間少,主要因為Gabor-DC-CNN是雙通道卷積神經網絡,需要分別進行訓練,所需時間稍長。
和3DCNN方法相比,訓練時間多了10s左右,主要因為使用了Gabor濾波器進行濾波,加入殘差會在原來的網絡結構上增加一條路徑,從而降低了網絡運行效率,增加了訓練時間。Log-Gabor-CNN是2DCNN,相比三維卷積在時間效率上會快一些,但同時分類精度會略有下降。Gabor-SVM是使用三維Gabor濾波和SVM進行分類,和其它深度學習方法相比優點在于省去了網絡訓練步驟,因此效率更高,和本文方法相比訓練時間快了50s左右,但分類精度不高。
3結論
本文針對高光譜圖像維度高,具有豐富的光譜信息和紋理信息的特性,提出了一種基于三維Gabor濾波器和殘差3DCNN的高光譜圖像分類方法。主要貢獻為:(1)通過三維Gabor濾波器得到的紋理特征和光譜信息,有助于高光譜遙感圖像的地物分類。(2)通過殘差三維卷積神經網絡對處理后的數據進行深層特征提取,得到深層光譜紋理特征,利用殘差模塊,有效解決了網絡訓練中梯度消失以及梯度爆炸問題,有效提高地物分類精度。實驗結果表明,本文提出的方法3DGabor-Res-3DCNN的分類精度能夠達到97.86%。與其它高光譜圖像分類方法相比,本文使用的方法能夠有效提高分類精度。在之后的研究工作中,準備在保證分類精度的同時,進一步提高算法的運行效率。
參考文獻(References):
[1]AhmadM,ShabbirS,OlivaD,etal.Spatial-priorgeneralizedfuzzinessextremelearningmachineautoencoder-basedactivelearningforhyperspectralimageclassification[J].Optik,2020,206:163712-.
[2]HSIEHPF.Impactandrealizationofincreasedclassessep-arabilityon thesmallsamplesizeprobleminthehyperspectralclassification[J].CanadianJournalofRemoteSensing,2009,35(3):248-261.
[3]KRIZHEVSKYA,SUTSKEVERI,HINTONGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[J].CommunicationsoftheACM,2017,60(6):84-90.
[4]CHENY,LINZ,ZHAOX,etal.DeepLearning-BasedClassificationofHyperspectralData[J].IEEEJournalofSelectedTopicsinAppliedEarthObservations&RemoteSensing,2017,7(6):2094-2107.
[5]HUANGS,WANGX,HEH,etal.HyperspectralImageClassificationBasedonBidirectionalRecurrentNeuralNetwork[C]//2019IEEEInternationalConferenceonSignalProcessing,CommunicationsandComputing(ICSPCC).IEEE,2019.
[6]H.LEE,H.KWON.ContextualdeepCNNbasedhyperspectralclassification[J].2016IEEEInternationalGeoscienceandRemoteSensingSymposium(IGARSS),Beijing,2016,pp.3322-3325,doi:10.1109/IGARSS.2016.7729859
作者:張明華1,牛玉瑩1,杜艷玲1,黃冬梅1,2,劉刻福3