久久人人爽爽爽人久久久-免费高清a级毛片在线播放-国产高清自产拍av在线-中文字幕亚洲综合小综合-无码中文字幕色专区

學術咨詢

讓論文發表更省時、省事、省心

機場高密度人群的行人檢索研究綜述

時間:2021年04月22日 分類:免費文獻 次數:

[摘要]如今現代機場遍布了監控設備以便監視者及時發現機場內的異常情況,這種傳統的監視方式極為耗費人力。由于行人檢索技術近年來得到了廣大專家和學者的普遍關注,新一代的智能監控設備有望代替機場內傳統的視頻監控設備。該技術利用深度學習算法自主性地

《機場高密度人群的行人檢索研究綜述》論文發表期刊:《科技經濟導刊》;發表周期:2021年09期

《機場高密度人群的行人檢索研究綜述》論文作者信息:陳卓

  [摘要]如今現代機場遍布了監控設備以便監視者及時發現機場內的異常情況,這種傳統的監視方式極為耗費人力。由于行人檢索技術近年來得到了廣大專家和學者的普遍關注,新一代的智能監控設備有望代替機場內傳統的視頻監控設備。該技術利用深度學習算法自主性地分析視頻數據,從而減輕了安全監管過程中的人力消耗。為了深入地了解行人檢索技術,首先對行人檢索的發展歷程進行簡要地梳理和總結;接著從局部特征、注意力機制和生成對抗網絡三個方面對深度學習算法展開介紹;然后列舉代表性數據集上的部分算法進行性能分析,最后總結了現階段行人檢索發展的主要難點,并對該技術的未來研究方向進行了預測。

  [關鍵詞]行人檢索;注意力機制;對抗網絡

  近年來隨著我國民航運輸的體系越來越完善,乘坐飛機在很大程度上提高了乘客的出行效率,這無疑對于游客來說有著巨大的吸引力。然而,這就意味著我國的一些大中小型機場將迎來大量的游客,人群密度也隨之增大,這在一定程度上對機場的安全運行產生了巨大壓力。因此,如何減少發生在機場這樣高密度人群場所的突發事件所產生的不良影響,一直是機場安全管理領域的研究熱點。

  通常情況下,一套完整的智能監控系統由三部分組成:行人檢測、行人追蹤和行人檢索。行人檢索即行人重識別。行人重識別旨在研究多個攝像頭在非重疊視角下拍攝到的行人是否為特定行人。可以實時地把行人的運動軌跡上傳至云端進行分析和處理。近年來,行人重識別已經得到了廣大專家和學者的普遍關注,并成為當前的安防領域主要研究方向之一,行人重識別的處理流程如圖1所示。

  1,基于人工特征的行人檢索

  行人重識別任務是研究多個攝像頭在非重疊視角下拍攝到的行人是否為指定行人的過程。該過程主要由提取到穩健的表示特征和相似性度量模型的建立兩個過程組成。提取特征的穩健與否將直接影響最終行人重識別模型的識別性能,而合理的距離度量函數將在一定程度上提高了識別的精準度。

  早期人工特征的方法主要是為了尋找行人在低分辨率、姿勢多變、部分被遮擋和拍攝角度差異的情況下行人身上不變的特征。常用的顏色特征有RGB和HSV等,紋理特征有SILTP和LBP等。為了應對特征數據的分散性和攝像機所受環境因素的干擾,近年來有研究者將多種圖像特征描述子進行充分融合。

  距離度量又稱相似性學習,本質上是一種特定的距離度量函數,該函數是根據需要而人為設計的。經典的距離度量函數就是馬氏距離。早在2002年,Xing等人提出了馬氏距離用于距離測度學習,由此奠定了未來距離度量學習的基石。無論哪種特征組合,只有一結合有效的度量學習才能使行人重識別模型的性能有大幅度的提高。

  2,基于神經網絡的行人檢索

  由于傳統行人重識別方法的特征提取以及距離度量學習是分離的兩階段結構,其檢索效率低、精準度不是很高。為了提高行人重識別模型的學習能力和減少標注樣本的代價。近年來,半監督學習和無監督學習的行人重識別研究備受關注。此外,一些研究工作提出了基于局部的學習方法,此方法不僅簡單,還可以獲得更具有判別性的特征。也有一些研究工作是采用生成對抗網絡或者以注意力機制的方法,該方法可以進一步提升模型特征提取能力。

  2.1局部特征

  現階段主要著力于研究如何降低外界因素對行人重識別的干擾和加強局部特征之間的聯系。其實,早期的行人重識別研究大家還是主要關注在全局特征,就是對整個圖像進行特征提取,然后將得到的特征向量進行行人檢索。但是研究者們逐漸發現此種方法已經無法再進一步提高識別的準確度。這時,就有研究者開始關注如何加強局部特征之間的聯系,使得能提取到更加穩健的特征向量。如Yaol"等人提出的部分損失網絡(Part Loss Network,PL-Net)的深度學習方法,該方法是將目標人物分成幾個部分來進行表示,由于沒有考慮局部特征之間的聯系以及對齊問題,導致提取到行人特征不是很穩健。而在2017年,Zhang等人考慮到以上問題,采用基于部件的方法提出了對齊識別模型,實現了局部特征和全局特征協同工作,并使提取的行人特征更加穩健。圖像分割、骨架關鍵點定位和姿態矯正等方法常常作為研究者們提取特征的參考方向。

  圖像分割的主要目標是將圖像劃分為具有獨特性質的區域。如 Bing Shuai 等人提出了一個長短時記憶網絡 (Long short term memory network, LSTM), 如圖 2 所示。該網絡接收到被分割

  好的若干塊圖像后,最終的特征是所有圖像塊局部特征的拼湊。

  2.1.2 骨架關鍵點定位和姿態矯正

  為了解決在圖像分割時行人圖像沒有對齊的情況,Longhui Weil等人提出了對齊特征描述子(Global Local Alignment Descriptor,GLAD),該特征描述子首先將人體分為幾個主要部件,接著將整張圖和幾個局部圖一起輸入到神經網絡中,最后將全局和局部的特征部件進行融合和提取。相關數據證明,該方法很好地解決了行人姿態變化的問題,并且GLAD取得了部件檢測的準確性與魯棒性之間的平衡。GLAD主要流程圖如圖3所示。

  2.2注意力機制

  注意力機制方法的本質就是模擬人類大腦的專注力模型,在看到一張圖像時,觀看感興趣的部分。在檢測過程中,為了解決行人遮擋、背景雜波和行人姿勢的大幅度形變等客觀因素引起的問題,研究者們針對這些客觀因素所引起的復雜問題提出許多有效地模型。如Li等人通過深入研究注意力機制后,提出了注意力融合卷積神經網絡(Harmonious Attention CNN,HA-CNN)模型。

  2.3生成對抗網絡

  自2014年Lan"1提出對抗生成網絡(Generative Adversarial Network,GAN)以來,GAN便逐漸地出現在該領域專家和研究者。

  GAN是生成模型的一種,它是在一種對抗博弈狀態中不斷篩選而產生的。生成對抗網絡的主要結構包括一個生成器G和一個判別器D,生成器是以輸入的向量生成虛假的樣本來干擾鑒別器的判斷,而判別器是用于判斷樣本是真是假。為了克服高密度人群的機場環境下游客的姿勢和監控設備周圍的環境光線等變化,Wei等人利用GAN提出了一種在保證行人本體前景不變的情況下,將背景轉換成預期數據集的人員遷移生成對抗網絡。以此來縮小源域與目標域之間的域差。生成對抗網絡簡要結構如圖4所示。

  3相關算法性能分析

  3.1常用的實驗評價指標

  在衡量算法性能時,有三種常見的度量準則:平均精度的均值(mean Average Precision,mAP)、Rank-N表格和積累匹配的特性曲線(Cumulative Match Characteristic,CMC)。mAP表示所有查詢圖片的每個查詢圖片與候選集匹配的平均精度求和再取平均的值,越接近100%,表示重識別效果越好。

  Rank-N表示搜索結果中最的nk圖中中概率.CMC曲線的縱坐標是識別率,因此縱坐標數值越大,表明識別效果越好。

  3.2實驗結果的對比

  表1是按照局部特征、注意力機制和生成對抗網絡三個方面對具有代表性的行人重識別方法進行了簡單歸類和總結。目前行人重識別領域的數據集種類很多且規模也越來越大,根據數據集類型的不同、行人數和簽方法的不同對常用數據集進行了比較。

  從表2中三類數據集的Rank值對比可以看出,基于神經網絡的算法普遍在性能上的表現較為突出。Zheng等人提出算法的主要特點是采用雙損失組合去增強特征的表達,也就是提高類內特征的聚攏性和類間特征的區分性,還通過比較特征可視化效果圖,可以看到雙損失能獲得更好的特征表達。但是該算法模型在新的場景下,如細粒度分類等,如何學習較魯棒的特征描述符,并進一步提高在大數據集上的性能還需進一步研究。

  4.結語

  近年來研究者們不斷地提出新的研究方法,以解決行人檢索系統在實際中應用所出現的問題,這說明了行人檢索領域近年來得到了廣大專家和學者的普遍關注。特別是,如何減少發生在機場這樣高密度人群場所的突發事件所產生的不良影響,從而保證我國民航運輸行業一直保持著強勁的發展勢頭具有重要的現實意義。通過以上實驗數據可知,行人檢索領域雖然取得了一些成果,但是由于行人姿勢的多變性和外界客觀因素的影響,行人檢索系統所表現的性能仍然達不到預期效果。因此,未來的行人檢索研究可以從數據完善、模型優化進行提升算法模型的性能。

  【參考文獻】

  [1]Hantao,Yao,Shiliang,et al.Deep Representation Learning With Part Loss for Person Re-Identification[J].Image Processing IEEE Transactions on, 2019.

  [2] Longhui Wei, Shiliang Zhang, Hantao Yao, Wen Gao, Qi Tian.Glad: Global-local-alignment descriptor for pedestrian retrievalUj.arXiv preprint arXiv: 1709.04329, 2017.

  [3] LI W, ZHU X, GONG S. Harmonious attention network for person re-identification[C1//Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Piscataway: IEEE, 2018: 2285-2294.

  [4] Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets[C//Advances in neural information processing systems. New York, NY: MIT Press, 2014: 2672-2680

  [5] Wang Haoran, Fan Yue, Wang Zexin, et al. Parameter-Free Spatial Attention Network for Person Re-Identificationl1I. arXiv:1811. 12150, 2018.

  [6] Zhong Zhun, Zheng Liang, Zheng Zhedong, et al. Camera styleadaptation for person re-identification[ CJ//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.Piscataway, NJ: IEEE Press, 2018: 5157-5166.

  [7] Zheng Zhedong, Zheng Liang, Yang Yi. Unlabeled samples generated by gan improve the person re-identification baseline in vitro[C]//Proceedings of the IEEE International Conference on Computer Vision. Piscataway, NI: IEEE Press, 2017: 3754-3762.

NOW!

Take the first step of our cooperation邁出我們合作第一步

符合規范的學術服務 助力您的學術成果走向世界


點擊咨詢學術顧問